ソフトウェアの種類・名前 | 利用目的 |
コーパス検索アプリケーション「中納言」 | コーパスの検索 |
表計算ソフトExcel | ピボットテーブルによる分析・グラフ作成 |
ワープロWord | 「スタイル」を利用したレポート作成 |
Web茶まめ | 形態素解析 |
テキストエディタ サクラエディタ | 正規表現を使ったテキストの検索・整形 |
キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%") AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー WITH OPTIONS tglKugiri="|" AND tglBunKugiri="#" AND limitToSelfSentence="1" AND tglFixVariable="2" AND tglWords="20" AND unit="1" AND encoding="UTF-16LE" AND endOfLine="CRLF"
キー: 語彙素="ワイン"; キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
一度にピボットテーブルで集計できるように一つの表にまとめる
ショートカットキーを活用すると便利
または、「検索条件式ごとに出力ファイルを分割する」を外して検索条件式で一度にダウンロード(ZIPファイルの中のcsvファイルを利用)
キー: 語彙素="ワイン"; キー: 語彙素="ウイスキー"; キー: 語彙素="ビール"; キー: 語彙素="ブランデー"; キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー; キー: 語彙素="日本" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
用例数ではなく、用例が一つでも出現したサンプルの数を調べたい場合
集計に必要な情報をフィールドから切り出すことで集計に使う
自分で作った(または誰かが用意してくれた)辞書データ(コーパスの見出し語に対する追加情報)を利用する
自分で作った(または誰かが用意してくれた)コーパスへのアノテーション(用例に対する注釈データ)を利用する
Excelで中納言検索結果の列を丸ごとコピーし、エディタで整形した後、Excelに貼り付ける
※慣れると文字列関数よりも早くて便利
文書の構造化とWordの使い方(レポートの書き方)