成蹊2007
- シラバス
- 授業に関するメールはこちらへ。小木曽 智信:seikei@ogiso.net
- 授業資料 のページにこの授業に関連する資料がおいてあります。
- 授業フォルダ file://U:\ogiso
- 授業資料/用語集リンク (わからないコンピュータ用語を調べてください)
第6回 6/22†
全文検索ソフト「ひまわり」の利用†
「ひまわり」で使用できる正規表現†
- 検索語/キー:普通の文字と、列挙型の文字クラス([あいう]のようなもの。[あ-う]は不可)
- 前文脈/後文脈:ほぼ全ての正規表現
- 「ひまわり」の検索結果を正規表現を使った置換で加工する
表計算ソフト Excel入門†
前文脈 | キー | 後文脈 | タイトル | 著者 | 著者ID | 生没年 | 原著者 | 原著者ID | 仮名遣い |
お知らせ†
- レポートテーマについて
- そろそろ、自分のレポートテーマを考えはじめてください。
- CD-Rについて
- 授業で使っているデータ(青空文庫・ひまわり)を家でも使いたい人は来週CD-Rを持ってきてください。
第7回 6/15†
テキストエディタ総復習・質問†
- これまでにやってきたテキストエディタ・正規表現の使い方について復習します。
小テスト†
第6回 6/8†
タグ付き正規表現を使った置換†
- K2エディタの使い方2005.pdf参照
- 走[らりるれろ] でGrepした結果を置換するにはどうしたらいいか
- 次のように置換するととんでもないことに
- 検索文字列:走[らりるれろ]
- 置換文字列:★走[らりるれろ]
- カッコ(半角丸カッコ)と$1($2,$3…)を使う
- 例
- 「ー」で終わるカタカナ語の「ー」を削除する
- 動詞「表わす」の表記を「表す」に統一する
- 授業資料/タグつき正規表現
タグ付き正規表現の応用†
古典文学作品のデータ†
授業フォルダ内参照
第5回 6/1 †
正規表現†
- 正規表現・補足
- 特殊文字のエスケープ 記号そのものを表す場合には\でエスケープする(例:1\+2)
- 最長一致の原則 greedy
- 課題
- 送りがなの揺れ(行う/行なう)
- "私は"で始まり"した。"で終わる行
- 会話("「"で始まる)
- "全然~ない"
第4回 5/11 †
テキストファイルと拡張子†
grepと置換でCSVファイルを作る(簡易版)†
- CSVファイルとは:テキストファイルで表を表現する
用語:CSVファイル
- KWIC:KeyWord In Context
正規表現入門†
- メタ文字 ― ワイルドカードと正規表現
- ワイルドカード >用語 cf.トランプのJoker
- 主にファイル名の指定で使う
- 文字を表すための文字(メタ文字) ?と* *1
- 正規表現 >用語
- 文字を表すための特殊な文字(メタ文字)
- 置換・検索・grepで利用できる
- すべて半角
- 特殊文字そのものを表す場合には\でエスケープする(例:1\+2)
第3回 4/27 テキストエディタの基礎†
- 授業フォルダ file://U:\ogiso
- 授業用テキストファイル
第2回 4/20 テキストデータとテキストエディタ†
授業で利用する主なソフトウェア†
K2Editor | テキストエディタ | 検索・整形 |
ひまわり | 全文検索ソフト | 検索・分析 |
Excel | 表計算ソフト | 分析・グラフ作成 |
Access | データベースソフト | 調査・分析 |
テキストデータ†
| 画像 | テキスト |
生データ | × | ◎ |
Webサービス/専用ソフト | × | △ |
テキストデータ≒テキストファイル≒電子化テキスト
テキストエディタ†
- テキストエディタのダウンロードとインストール
- 圧縮ファイルの展開(解凍)
- 圧縮・展開ソフト(アーカイバ 用語)
- zip,lzh形式
- +Lhaca
- テキストエディタの設定
- 行の折り返し
- 行番号表示
- スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)
第1回 4/13 イントロダクション†
ワイルドカードの「?」「*」は、後で説明する正規表現の「?」「*」とは意味が違うので注意。ワイルドカードの「?」は正規表現で「.」、「*」は「.*」。