select * from corpus as corpus_1 inner join corpus as corpus_2 on corpus_1.ID+1 = corpus_2.ID where ・・・・・・
前文脈 | キー | 後文脈 | タイトル | 著者 | 著者ID | 生没年 | 原著者 | 原著者ID | 仮名遣い | コーパス名 |
(続きは次回)
この授業ではBCCWJ(モニター公開版)・太陽コーパスのほか、青空文庫・国会会議録などの広義のコーパスも取り扱う。
秀丸エディタ | テキストエディタ | 検索・整形 |
ひまわり | 全文検索ソフト | 検索・分析 |
MeCab | 形態素解析器 | 形態素解析 |
UniDic | 形態素解析辞書 | |
Excel | 表計算ソフト | 集計・分析・グラフ作成 |
Access | データベースソフト | 集計・分析 |
Word | ワープロ | レポート作成 |
このほかにWeb上で利用できるサービスも取り上げます。
最初に、テキストエディタを使ってテキストデータを扱うことからはじめます。
全ての基本。テキストデータ≒テキストファイル≒電子化テキスト