*成蹊大学 日本語日本文学のためのコンピュータ (後期) [#x0df355b] -授業に関するメールはこちらへ。小木曽 智信:seikei@ogiso.net -[[授業資料]] のページにこの授業に関連する資料がおいてあります。 -授業フォルダ file://U:\ogiso -授業資料/用語集リンク (わからないコンピュータ用語を調べてください) **1/19 [#y48768ff] -レポート作成2 ***形態素解析(参考) [#ad0c3ca3] ***Accessの利用 [#u02b591a] **1/12 [#bc43e0db] -レポート作成 ***Accessの利用 [#u02b591a] ***太陽コーパス・近代女性雑誌コーパス [#a37af685] ***形態素解析(参考) [#ad0c3ca3] **12/22 [#x3eeb26f] ***Excelによる分析2 [#f9a178c6] ***太陽コーパス・近代女性雑誌コーパス [#a37af685] **12/15 [#jbcbca7c] ***全文検索ソフト「ひまわり」 [#tae381fe] -「ひまわり」 [[国立国語研究所/言語データベースとソフトウェア/ひまわり>http://www.kokken.go.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9]] -「ひまわり」を授業フォルダに入れ、青空文庫を検索できるようにしてあります。file://U:\小木曽\himawari -「ひまわり」で使用できる正規表現 --検索語/キー:普通の文字と、列挙型の文字クラス([あいう]のようなもの。[あ-う]は不可) --前文脈/後文脈:ほぼ全ての正規表現 ***Excelによる分析 [#c01a6d3a] -並べ替え -オートフィルタ --オートフィルタの「オプション」 -分類データの入力 -ピボットテーブルとピボットグラフ -関数を使う --=left(xx,n) -区切り位置(メニュー>データ>区切り位置) ***データのCD-Rについて [#t2c508b9] **12/01 正規表現復習・レポートテーマの検討 [#we45dd4b] -課題の答え合わせ -レポートテーマの検討 -「ひまわり」の利用 **11/17 正規表現・タグつき正規表現 [#d70bc225] -[[授業資料/正規表現]] **休講 10/20 (四大戦) [#d629ef1c] **第4回 10/13 テキストエディタ(2) [#d85e2401] ***復習 [#xc9dae9a] -置換・検索・grep --夏目漱石『行人』における「兄」の初出行 --夏目漱石『行人』における「母」の用例数 --太宰治『走れメロス』における「メロス」の用例数 ***grep(複数のファイルを検索) [#kfb37c1d] --夏目漱石の「飲む」 --太宰治の「飛べ」 ***テキストファイルと拡張子 [#c15ea011] -TXTファイル -CSVファイル ***grepと置換でCSVファイルを作る(簡易版) [#u3ab2d6f] -CSVファイルとは:テキストファイルで表を表現する [[用語:CSVファイル>http://www.microsoft.com/japan/Terminology/query.asp?id=3334&q=CSV&kbid=&key=&ui=L&dev=]] -KWIC:KeyWord In Context -参考:[[grepと置換でKWICを作る>授業資料/grepと置換でKWICを作る]] ***メタ文字 ― ワイルドカードと正規表現 [#d0de5e25] -''ワイルドカード'' [[>用語>http://e-words.jp/w/E383AFE382A4E383ABE38389E382ABE383BCE38389.html]] cf.トランプのJoker --主にファイル名の指定で使う --文字を表すための文字(メタ文字) ?と* ((ワイルドカードの「?」「*」は、後で説明する正規表現の「?」「*」とは意味が違うので注意。ワイルドカードの「?」は正規表現で「.」、「*」は「.*」。)) |?|任意の1文字| |*|任意の長さの文字列| -''正規表現'' [[>用語>http://e-words.jp/w/E6ADA3E8A68FE8A1A8E78FBE.html]] --文字を表すための特殊な文字(メタ文字) --置換・検索・grepで利用できる --すべて半角 --特殊文字そのものを表す場合には\でエスケープする(例:1\+2) -[[授業資料/正規表現]] ***解凍用ソフト [#ve477f0c] http://park8.wakwak.com/~app/Lhaca/ **第3回 10/6 テキストエディタの基礎 [#k1aa72b4] -テキストエディタの設定 --行の折り返し --行番号表示 ---スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号) -[[授業資料/K2Editorの使い方>授業資料#bf35bd53]] -検索・置換、grep -[[授業資料/覚えておきたいショートカットキー]] **第2回 9/29 テキストデータとテキストエディタ [#g53e1e46] -授業ページへのショートカット ***テキストデータ [#wee47413] テキストデータ≒テキストファイル≒電子化テキスト -テキストデータとはどんなものか --[[授業資料/テキストデータとは]] --[[授業資料/テキストデータ紹介]] ***テキストエディタ [#q7ae852c] -テキストエディタとはどんなものか --[[授業資料/テキストエディタ]] -テキストエディタのダウンロードとインストール --[[K2Editor>http://k2top.jpn.org/]] http://k2top.jpn.org/ -圧縮ファイルの展開(解凍) --圧縮・展開ソフト(アーカイバ [[用語>http://e-words.jp/w/E382A2E383BCE382ABE382A4E38390.html]]) --zip,lzh形式 --+Lhaca **第1回 9/22 イントロダクション [#t3a60d7a] -自己紹介 -この授業の目的 -授業の進め方 -評価方法 ***授業で使用する主なソフトウェア [#i06478d2] |''K2Editor''|テキストエディタ|検索・整形| |''ひまわり''|全文検索ソフト|検索・分析| |''Excel''|表計算ソフト|分析・グラフ作成| -用例検索・整理のデモ //小森昌人 l052050 //欅祭委員会 // 16:40~17:15 // 9/29,10/27,11/17,12/1