集計に必要な情報をフィールドから切り出すことで集計に使う
用例数ではなく、用例が一つでも出現したサンプルの数を調べたい場合
ショートカットキーを活用すると便利
キー: 語彙素="ワイン"; キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
一度にピボットテーブルで集計できるように一つの表にまとめる
キー: 語彙素="ビール"; キー: 語彙素="ワイン"; キー: 語彙素="ブランデー"; キー: 語彙素="ウイスキー"; キー: 語彙素="焼酎"; キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー; キー: 語彙素="日本" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
どのコーパスにも向き不向きがあり、設計を踏まえた適切な利用が必要
※語数表はコーパスの(サンプルごとの)語数をまとめた表。語彙表はコーパスの語彙(見出し語)ごとの使用頻度をまとめたもの
キー: 品詞 LIKE "名詞%" AND 共起: 語彙素="美しい" BETWEEN -3 AND 3 WORDS FROM キー
キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%") AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー WITH OPTIONS tglKugiri="|" AND tglBunKugiri="#" AND limitToSelfSentence="1" AND tglFixVariable="2" AND tglWords="20" AND unit="1" AND encoding="UTF-16LE" AND endOfLine="CRLF"
↓これだけでもいい(IN 以下の検索対象コーパスやWITH OPTIONS 以下は式で指定がない場合、検索画面での設定に従う)
キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%") AND 後方共起: 語彙素="言葉" ON 1 WORDS FROM キー
キー: (品詞 LIKE "形容詞%" AND 活用形 LIKE "連体形%") AND 後方共起: (語彙素="言葉" OR 語彙素="言語") ON 1 WORDS FROM キー
『日本語日常会話コーパス』『日本語歴史コーパス』『昭和・平成書き言葉コーパス』
(以下スライド参照)
『現代日本語書き言葉均衡コーパス』『昭和・平成書き言葉コーパス』
(以下スライド参照)
ソフトウェアの種類・名前 | 利用目的 |
コーパス検索アプリケーション「中納言」 | コーパスの検索 |
表計算ソフトExcel | ピボットテーブルによる分析・グラフ作成 |
ワープロWord | 「スタイル」を利用したレポート作成 |
Web茶まめ | 形態素解析 |