一橋2008
日本語学講義(I) 日本語コーパス研究†
第4回 2008/10/24 正規表現†
メタ文字 ― ワイルドカードと正規表現†
- ワイルドカード >用語 cf.トランプのJoker
- 主にファイル名の指定で使う
- 文字を表すための文字(メタ文字) ?と* *1
正規表現とは†
- 正規表現 >用語
- 文字を表すための特殊な文字(メタ文字)
- 置換・検索・grepで利用できる
- 記号はすべて半角
- 特殊文字そのものを表す場合には\でエスケープする(特殊な意味を打ち消す) 例:1\+2
正規表現のいろいろ:†
#amazon(4873111706)
#amazon(4873113598)
正規表現の応用†
- 課題
- 送りがなの揺れ(行う/行なう)
- 私はで始まりした。で終わる行
- 会話(「で始まる)
- 全然~ない
第3回 2008/10/17 テキストエディタを使う†
- テキストエディタの基礎
- スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)
- ファイルの作成と保存
- 検索と置換
- grepとその応用
- 応用
grepと置換でCSVファイルを作る†
- grep結果の置換による整形
- CSVファイルとは:テキストファイルで表を表現する
用語:CSVファイル
- CSVファイルをExcelで開く
- KWIC:KeyWord In Context
テキストファイルと拡張子†
ショートカットキー†
第2回 2008/10/10 テキストデータとテキストエディタ†
授業で利用する主なソフトウェア†
最初に、テキストエディタを使ってテキストデータを扱うことからはじめます。
テキストデータ†
テキストデータ≒テキストファイル≒電子化テキスト
テキストエディタ†
2008/10/03 イントロダクション†