VSCodeの検索で「.*」をクリックして正規表現モードをオン
文書の構造化とWordの使い方(レポートの書き方)
調査対象の語をコーパス全体の中に位置づける、他の語と比較する
集計に必要な情報をフィールドから切り出すことで集計に使う
自分で作った(または誰かが用意してくれた)辞書データ(コーパスの見出し語に対する追加情報)を利用する
自分で作った(または誰かが用意してくれた)コーパスへのアノテーション(用例に対する注釈データ)を利用する
「検索条件式ごとに出力ファイルを分割する」を外して検索条件式で一度にダウンロード(ZIPファイルの中のcsvファイルを利用)
キー: 品詞 LIKE "名詞%" AND 前方共起: (語彙素="美しい" AND 活用形 LIKE "連体形%") ON 1 WORDS FROM キー; キー: 品詞 LIKE "名詞%" AND 前方共起: 語彙素="奇麗" ON 2 WORDS FROM キー AND 前方共起: (語彙素="だ" AND 活用形 LIKE "連体形%") ON 1 WORDS FROM キー;
用例数ではなく、用例が一つでも出現したサンプルの数を調べたい場合
一度にピボットテーブルで集計できるように一つの表にまとめる
ショートカットキーを活用すると便利
キー: 語彙素="ワイン"; キー: 語彙素="葡萄" AND 後方共起: 語彙素="酒" ON 1 WORDS FROM キー;
(以下スライド参照)
ソフトウェアの種類・名前 | 利用目的 |
コーパス検索アプリケーション「中納言」 | コーパスの検索 |
表計算ソフトExcel | ピボットテーブルによる分析・グラフ作成 |
ワープロWord | 「スタイル」を利用したレポート作成 |
Web茶まめ | 形態素解析 |
テキストエディタ サクラエディタ | 正規表現を使ったテキストの検索・整形 |