[[成蹊2008/日本語学講義B]] *形態素解析と結果の利用 [#i3041997] ***期末小レポートの素材作成 [#jd8b78a1] +テキストの収集 --インターネット上からテキストを集めてくる ---あとでグループにして比較できるように二つ以上のジャンルから --メモ帳などに貼り付けて1文ごとに改行されるように整形 --グループ毎にまとめられるファイル名をつけて保存(例:新聞・社会1.txtなど) +茶まめを使って解析 --ファイルから解析 ---~*.txt(フォルダ内のテキストファイルを全て解析) --解析オプション ---半角文字を全角に変換:ON ---数字処理:簡易モード --単一ファイルに出力(merge):ON --表に列名を出力:ON +データベースへの取り込み(Access) --空のデータベースを作る --解析結果の取り込み(インポート) --解析結果の取り込み(=インポート) ---merge.txtを指定 ---文字コードをUTF-8に変更 ---先頭行をフィールド名にする:ON --品詞リストの取り込み +クエリの作成(Access) --語種別の集計(延べ語数) --異なり語リストの作成 --品詞別の集計(テーブルの結合) --語種別の集計(異なり語数)(クエリをもとにしたクエリ) +グラフの作成(Excel) --必要な結果をコピー&ペースとしてグラフ作成 --必要な結果をコピー&ペーストしてグラフ作成 ---Access上でグラフを作ることもできるがコピーなどができなくて不便 ---ExcelからAccessのデータベースに接続して、クエリ結果をExcelの表として扱うこともできる(応用レベル)