日本語日本文学のためのコンピュータ†
- パソコンを使うだけではレポートは完成しません。必ず図書館で資料にあたってテーマについて調べ、考察を深めてください。
- 少なくとも自分が調べる語について『日本国語大辞典』などの大型辞典をひいておくこと。
第10回 6/30 Excelを使った分析†
- 資料の持ち帰りについて
- 自宅で「ひまわり」・青空文庫のデータを利用したい人は、CD-Rか容量の大きなUSBメモリを用意してきてください。
- 古典の資料について
Excelを使った処理†
- 例:「新聞紙」の意味の変化
- ピボットテーブルとピボットグラフ
- 文字列処理関数
- 「ひまわり」の検索結果をエディタ(正規表現を使った置換)で加工する
レポートについて†
- 内容:授業時間中に進めているテーマ
- 授業で学んだコンピュータの利用方法を活用すること
- パソコン・ネットだけでなく書籍・図書館で調査した内容をできるだけ取り込むこと
- 枚数:目安としてA4用紙4枚以上(グラフ・用例を含む)
第9回 6/23 ひまわりとExcel†
ひまわりと正規表現†
- 「ひまわり」で使用できる正規表現
- 検索語/キー:普通の文字と、列挙型の文字クラス([あいう]のようなもの。[あ-う]は不可)
- 前文脈/後文脈:ほぼ全ての正規表現
Excel†
- 並べ替え(ソート)
- オートフィルタ(絞り込み)
- ピボットテーブルとピボットグラフ (詳しくは来週)
前文脈 | キー | 後文脈 | タイトル | 著者 | 著者ID | 生没年 | 原著者 | 原著者ID | 仮名遣い |
レポートテーマ†
- 授業で紹介したエディタや表計算ソフトの使い方を活かして、用例を元にしてたとえば次のようなテーマでレポートをまとめてもらいます。データは授業フォルダ内のものを自由に利用してください。
- 例:作家ごとの言葉の使い方の違い
- 例:類義語の意味の違い
- 例:語の用法の変化
- 例:語形・(表記)のゆれ
- などなど
第8回 6/16 エディタ・正規表現小テスト†
エディタ・正規表現小テスト†
「ひまわり」による検索†
第7回 6/9 エディタ・正規表現の復習,全文検索システムひまわり†
(来週、エディタの使い方・正規表現の小テストを行います)
- エディタの使い方
- 検索、上候補、下候補
- 置換
- フォルダ内のファイルのgrep
- 開いているファイルのgrep
- grepと置換でKWIC(CSVファイル)を作る
- 正規表現の復習
- 文字クラス
- 繰り返し
- タグ付き正規表現を使った置換
全文検索システム「ひまわり」の利用†
第6回 6/2 タグ付き正規表現†
- 配付資料「K2エディタの使い方」参照
- 走[らりるれろ] でGrepした結果を置換するにはどうしたらいいか
- 次のように置換するととんでもないことに
- 検索文字列:走[らりるれろ]
- 置換文字列:★走[らりるれろ]
- カッコ(半角丸カッコ)と$1($2,$3…)を使う
- 例
- 「ー」で終わるカタカナ語の「ー」を削除する
- 動詞「表わす」の表記を「表す」に統一する
- 授業資料/タグつき正規表現
第5回 5/26 正規表現†
#amazon(4873111706)
#amazon(4873113598)
正規表現の応用†
- 課題
- 送りがなの揺れ(行う/行なう)
- 私はで始まりした。で終わる行
- 会話(「で始まる)
- 全然~ない
第4回 5/19 置換の応用・正規表現入門†
テキストファイルと拡張子†
grepと置換でKWIC(CSVファイル)を作る(簡易版)†
- CSVファイルとは:テキストファイルで表を表現する
用語:CSVファイル
- KWIC:KeyWord In Context
正規表現入門†
- 正規表現 >用語
- 文字を表すための特殊な文字(メタ文字)
- 置換・検索・grepで利用できる
- 記号はすべて半角
- 特殊文字そのものを表す場合には\でエスケープする(特殊な意味を打ち消す) 例:1\+2
第3回 5/12 テキストエディタ†
- テキストエディタの設定
- 行の折り返し
- 行番号表示
- スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)
5/12 休講†
第2回 4/21 電子化テキスト†
- 電子化テキストとは
- バイナリファイルとテキストファイル
- ファイルの種類と拡張子 参考:拡張子辞典
- テキストファイルとHTML
テキストエディタ†
- テキストエディタとはどんなものか
- テキストエディタのダウンロードとインストール
- 圧縮ファイルの展開(解凍)
第1回 4/14 イントロダクション†
授業で利用する主なソフトウェア†