※同じことは、文字列関数の組み合わせや、キーの位置を変えた二つの検索結果を組み合わせたVLOOKUPでも頑張ればできる。が、かなりたいへん。
自分で作った(または誰かが用意してくれた)辞書データ(コーパスの見出し語に対する追加情報)を利用する
自分で作った(または誰かが用意してくれた)コーパスへのアノテーション(用例に対する注釈データ)を利用する
集計に必要な情報をフィールドから切り出すことで集計に使う
用例数ではなく、用例が一つでも出現したサンプルの数を調べたい場合
キー: 語彙素="ワイン"; キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
一度にピボットテーブルで集計できるように一つの表にまとめる
ショートカットキーを活用すると便利
キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%") AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー WITH OPTIONS tglKugiri="|" AND tglBunKugiri="#" AND limitToSelfSentence="1" AND tglFixVariable="2" AND tglWords="20" AND unit="1" AND encoding="UTF-16LE" AND endOfLine="CRLF"
(Moodleに置いたスライド参照)
(以下、Moodleに置いたスライドも参照)
ソフトウェアの種類・名前 | 利用目的 |
コーパス検索アプリケーション「中納言」 | コーパスの検索 |
表計算ソフトExcel | ピボットテーブルによる分析・グラフ作成 |
Web茶まめ | 形態素解析 |
テキストエディタ サクラエディタ | 正規表現を使ったテキストの検索・整形 |
ワープロWord | 「スタイル」を利用したレポート作成 |
全文検索ソフトひまわり | データの検索,ミニコーパスの作成 |
R | データの統計分析 |