集計に必要な情報をフィールドから切り出すことで集計に使う
自分で作った(または誰かが用意してくれた)辞書データ(コーパスの見出し語に対する追加情報)を利用する
キー: 品詞 LIKE "名詞%" AND 前方共起: 語彙素="可愛い" ON 1 WORDS FROM キー
=VLOOKUP(<語彙素ID>,BunruiNo_LemmaID!$A$1:$B$65044,2,FALSE)
用例数ではなく、用例が一つでも出現したサンプルの数を調べたい場合
ショートカットキーを活用すると便利
キー: 語彙素="ワイン"; キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
一度にピボットテーブルで集計できるように一つの表にまとめる
キー: 語彙素="ビール"; キー: 語彙素="ワイン"; キー: 語彙素="ブランデー"; キー: 語彙素="ウイスキー"; キー: 語彙素="焼酎"; キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー; キー: 語彙素="日本" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%") AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー WITH OPTIONS tglKugiri="|" AND tglBunKugiri="#" AND limitToSelfSentence="1" AND tglFixVariable="2" AND tglWords="20" AND unit="1" AND encoding="UTF-16LE" AND endOfLine="CRLF"
↓これだけでもいい(IN 以下の検索対象コーパスやWITH OPTIONS 以下は式で指定がない場合、検索画面での設定に従う)
キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%") AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー
キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%") AND 後方共起: (語彙素="言葉" OR 語彙素="言語") ON 1 WORDS FROM キー
キー: 品詞 LIKE "名詞%" AND 共起: 語彙素="美しい" BETWEEN -3 AND 3 WORDS FROM キー
『日本語日常会話コーパス』『日本語歴史コーパス』『昭和・平成書き言葉コーパス』
(以下スライド参照)
『現代日本語書き言葉均衡コーパス』
(以下スライド参照)
ソフトウェアの種類・名前 | 利用目的 |
コーパス検索アプリケーション「中納言」 | コーパスの検索 |
表計算ソフトExcel | ピボットテーブルによる分析・グラフ作成 |
ワープロWord | 「スタイル」を利用したレポート作成 |
Web茶まめ | 形態素解析 |
テキストエディタ VisualStudio Code | テキストデータの作成・整備、正規表現を使った検索など |