日本語日本文学のためのコンピュータ†
第4回 5/26 正規表現†
#amazon(4873111706)
#amazon(4873113598)
正規表現の応用†
- 課題
- 送りがなの揺れ(行う/行なう)
- 私はで始まりした。で終わる行
- 会話(「で始まる)
- 全然~ない
タグ付き正規表現を使った置換†
- 配付資料「K2エディタの使い方」参照
- 走[らりるれろ] でGrepした結果を置換するにはどうしたらいいか
- 次のように置換するととんでもないことに
- 検索文字列:走[らりるれろ]
- 置換文字列:★走[らりるれろ]
- カッコ(半角丸カッコ)と$1($2,$3…)を使う
- 例
- 「ー」で終わるカタカナ語の「ー」を削除する
- 動詞「表わす」の表記を「表す」に統一する
- 授業資料/タグつき正規表現
第4回 5/19 置換の応用と正規表現†
テキストファイルと拡張子†
grepと置換でKWIC(CSVファイル)を作る(簡易版)†
- CSVファイルとは:テキストファイルで表を表現する
用語:CSVファイル
- KWIC:KeyWord In Context
正規表現入門†
- 正規表現 >用語
- 文字を表すための特殊な文字(メタ文字)
- 置換・検索・grepで利用できる
- 記号はすべて半角
- 特殊文字そのものを表す場合には\でエスケープする(特殊な意味を打ち消す) 例:1\+2
第3回 5/12 テキストエディタ†
- テキストエディタの設定
- 行の折り返し
- 行番号表示
- スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)
5/12 休講†
第2回 4/21 電子化テキスト†
- 電子化テキストとは
- バイナリファイルとテキストファイル
- ファイルの種類と拡張子 参考:拡張子辞典
- テキストファイルとHTML
テキストエディタ†
- テキストエディタとはどんなものか
- テキストエディタのダウンロードとインストール
- 圧縮ファイルの展開(解凍)
第1回 4/14 イントロダクション†
授業で利用する主なソフトウェア†