2016/02/03
2限 『日本語歴史コーパス』(CHJ)の概要
- 『日本語歴史コーパス』の拡張 2016.3
- 形態論情報付き「近代雑誌コーパス」の統合(『太陽』はコアのみで残りは2016年度中)
- 「平安時代編」への『大鏡』『蜻蛉日記』の追加
- 「鎌倉時代編Ⅰ説話・随筆」
- 「室町時代編Ⅰ狂言」長単位
3限 BCCWJとCHJの形態論情報
4限 「中納言」によるコーパスの検索
5限 コーパス検索結果の集計
複数の検索結果をまとめる
分類用のフィールドを作って集計する
サンプリング調査
- 大量に用例があり、調査内容からすべて対象にできない場合
- ランダムに並べ替え→先頭n例を調査対象に
- ランダムな数字の列: =rand()
- ランダムな数字の列をコピーして値として貼り付けると数字が固定される
関数の利用
- 集計用に用意した列で文字列処理関数を利用する
- LEFT,RIGHT,MID,LEN,SEARCH,SUBSTITUTE
- 応用例:品詞の大分類を使う
- =IFERROR(LEFT(<品詞>,SEARCH("-",<品詞>)-1),<品詞>)