2014年9月4日木曜日

7.【ツールの利活用】ビックデータ、オープンデータを用いたテキスト解析


テキスト解析、テキストマイニングとは・・・?
 膨大な文章から、代表的な意味のつながりを抽出する技術です。

今回は、1万近くのブログ記事をクロール&スクレイピングし、ユーザー別(石垣島在住、非在住)に分類しました。それぞれのユーザーの発言のうち、段落内のテキストを分析し以下の統計情報を「発言者の関心の表れ」と関係付けました。

・文の中での中心性
・言葉の関連性
・意味の参照率

を日本語分析ソフトを通して解析しました。

以下の動画に解析までの流れを先ほどまとめましたのでご覧ください。



0 件のコメント:

コメントを投稿