成蹊2006
成蹊大学 日本語日本文学のためのコンピュータ†
- 授業に関するメールはこちらへ。小木曽 智信:seikei@ogiso.net
- 授業に関する掲示板 にこの授業用の掲示板を用意しました。質問があったら書き込んでください。
- 授業資料 のページにこの授業に関連する資料がおいてあります。
- 授業フォルダ file://U:\ogiso
- 授業資料/用語集リンク (わからないコンピュータ用語を調べてください)
第13回(最終回) 7/14 レポートの完成と提出†
授業時間中がレポート提出期限です。
ただし、メールでの提出は21日(深夜12時)までとします。
メールで提出する場合は、授業中に申し出た上で、今週中にレポートを送るのと同じアドレスからのメールで連絡してください。レポート到着時(または期限になっても到着しないとき)にはこのアドレスに連絡します。
第12回 7/7 レポートテーマの決定と準備(2)†
今日を入れて残すところあと2回。来週で最後です。
レポート準備†
- 自分のテーマにあわせて検索・分類・集計などを行ってください。
- テーマにあわせた検索や分析の方法について、どんどん質問してください
- パソコンを使うだけではレポートは完成しません。必ず図書館で資料にあたってテーマについて調べ、考察を深めてください。
- 少なくとも自分が調べる語について『日本国語大辞典』などの大型辞典をひいておくこと。
レポートについて†
- 内容:授業時間中に進めているテーマ
- 授業で学んだコンピュータの利用方法を活用すること
- パソコン・ネットだけでなく書籍・図書館で調査した内容をできるだけ取り込むこと
- 枚数:目安としてA4用紙4枚以上(グラフ・用例を含む)
- 提出期限:7月14日(来週)授業時間中
- ただし、メールでの提出はもう少し猶予あり
- メールで提出する場合は、来週中に(レポートを送るのと同じアドレスからの)メールで申し出ること
第11回 6/30 レポートテーマの決定と準備(1)†
アンケート†
Excelによる分析(復習)†
レポートテーマ†
考えてきたレポートテーマを書き込んでください(後で変更があってもかまいません)
レポート準備†
- 考えてきたテーマにあわせて各自検索などを行ってください。
- 自分のテーマにはどのような方法が有効か、どんどん質問してください
第10回 6/23 Excelによる分析†
Excelによる分析†
- 分類データの入力
分類 | 前文脈 | キー | 後文脈 | タイトル | 著者 | 著者ID | 生没年 | 原著者 | 原著者ID | 仮名遣い |
レポートテーマについて†
- 来週から、自分のレポートテーマに必要な作業を授業の中で行っていきます。テーマを考えておいてください。
第9回 6/16 小テスト†
データのCD-Rについて†
- 青空文庫のテキストデータや、テキストエディタ(K2Editor)、青空文庫が検索できる「ひまわり」 などは、CD-Rにコピーして持ち帰ってもかまいません。方法を説明するので、必要な人は自分でディスクを用意してコピーしてください。
- 基本的にWindows用ですが、テキストデータと「ひまわり」は他のOSでも利用可能です。
テキストエディタ・正規表現 小テスト†
レポートテーマについて†
- 提出日は授業最終日です。(間に合わない場合には、メールでの提出も認めますが、最終日に申し出てください)
- 来週以降、自分のレポートテーマに必要な作業を授業の中で行っていきます。テーマを考えておいてください。
第8回 6/9 「ひまわり」とExcel†
正規表現・補足†
全文検索ソフト「ひまわり」を使う†
「ひまわり」で使用できる正規表現†
- 検索語/キー:普通の文字と、列挙型の文字クラス([あいう]のようなもの。[あ-う]は不可)
- 前文脈/後文脈:ほぼ全ての正規表現
- 「ひまわり」の検索結果を正規表現を使った置換で加工する
表計算ソフト Excel入門†
小テスト予告†
- 来週、テキストエディタの使い方と正規表現についての簡単な小テストを行います。
第7回 6/2 タグ付き正規表現†
タグ付き正規表現を使った置換†
K2エディタの使い方2005.pdf参照
- 走[らりるれろ] でGrepした結果を置換するにはどうしたらいいか
- 次のように置換するととんでもないことに
- 検索文字列:走[らりるれろ]
- 置換文字列:★走[らりるれろ]
- カッコ(半角丸カッコ)と$1($2,$3…)を使う
タグ付き正規表現の応用†
^([^,]*,[^,]*,)(.*)(,走[らりるれろつっ],)([^,]*)(,走[らりるれろつっ],.*)$
↓
$1$2$3$4\n$1$4$5
古典文学作品のデータ†
授業フォルダ内参照
第6回 5/26 正規表現†
- 正規表現・補足
- 特殊文字のエスケープ 記号そのものを表す場合には\でエスケープする(例:1\+2)
- 最長一致の原則 greedy
- 課題
- 送りがなの揺れ(行う/行なう)
- "私は"で始まり"した。"で終わる行
- 会話("「"で始まる)
- "全然~ない"
第5回 5/19 テキストエディタ(3) 正規表現入門†
メタ文字 ― ワイルドカードと正規表現†
- ワイルドカード >用語 cf.トランプのJoker
- 主にファイル名の指定で使う
- 文字を表すための文字(メタ文字) ?と* *1
- 正規表現 >用語
- 文字を表すための特殊な文字(メタ文字)
- 置換・検索・grepで利用できる
- すべて半角
- 特殊文字そのものを表す場合には\でエスケープする(例:1\+2)
第4回 5/12 テキストエディタ(2)†
次の資料を印刷して使ってください(室内のプリンタに出力)
- 検索で初出行を調べる
- 置換で用例数を数える
- ex.夏目漱石『行人』における「母」の用例数
- ex.太宰治『走れメロス』における「メロス」の用例数
grepと置換でCSVファイルを作る(簡易版)†
- CSVファイルとは:テキストファイルで表を表現する
用語:CSVファイル
- KWIC:KeyWord In Context
第3回 4/28 テキストエディタの基礎†
- 授業フォルダ file://U:\ogiso
- 授業用テキストファイル
テキストファイルと拡張子†
第2回 4/21 テキストデータとテキストエディタ†
テキストデータ†
テキストデータ≒テキストファイル≒電子化テキスト
テキストエディタ†
- テキストエディタのダウンロードとインストール
- 圧縮ファイルの展開(解凍)
- 圧縮・展開ソフト(アーカイバ 用語)
- zip,lzh形式
- +Lhaca
- テキストエディタの設定
- 行の折り返し
- 行番号表示
- スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)
第1回 4/14 イントロダクション†
授業で利用する主なソフトウェア†
K2Editor | テキストエディタ | 検索・整形 |
ひまわり | 全文検索ソフト | 検索・分析 |
Excel | 表計算ソフト | 分析・グラフ作成 |