*成蹊大学 日本語日本文学のためのコンピュータ (後期) [#x0df355b]

-授業に関するメールはこちらへ。小木曽 智信:seikei@ogiso.net
-[[授業資料]] のページにこの授業に関連する資料がおいてあります。
-授業フォルダ file://U:\ogiso
-授業資料/用語集リンク (わからないコンピュータ用語を調べてください)

**1/19 [#y48768ff]
-レポート作成2

***形態素解析(参考) [#ad0c3ca3]
***Accessの利用 [#u02b591a]


**1/12 [#bc43e0db]
-レポート作成

***Accessの利用 [#u02b591a]
***太陽コーパス・近代女性雑誌コーパス [#a37af685]

***形態素解析(参考) [#ad0c3ca3]

**12/22 [#x3eeb26f]

***Excelによる分析2 [#f9a178c6]

***太陽コーパス・近代女性雑誌コーパス [#a37af685]


**12/15 [#jbcbca7c]

***全文検索ソフト「ひまわり」 [#tae381fe]
-「ひまわり」 [[国立国語研究所/言語データベースとソフトウェア/ひまわり>http://www.kokken.go.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9]]
-「ひまわり」を授業フォルダに入れ、青空文庫を検索できるようにしてあります。file://U:\小木曽\himawari

-「ひまわり」で使用できる正規表現
--検索語/キー:普通の文字と、列挙型の文字クラス([あいう]のようなもの。[あ-う]は不可)
--前文脈/後文脈:ほぼ全ての正規表現


***Excelによる分析 [#c01a6d3a]
-並べ替え
-オートフィルタ
--オートフィルタの「オプション」

-分類データの入力

-ピボットテーブルとピボットグラフ
-関数を使う
--=left(xx,n)

-区切り位置(メニュー>データ>区切り位置)

***データのCD-Rについて [#t2c508b9]

**12/01 正規表現復習・レポートテーマの検討 [#we45dd4b]
-課題の答え合わせ
-レポートテーマの検討
-「ひまわり」の利用

**11/17 正規表現・タグつき正規表現 [#d70bc225]

-[[授業資料/正規表現]]

**休講 10/20 (四大戦) [#d629ef1c]

**第4回 10/13 テキストエディタ(2) [#d85e2401]

***復習 [#xc9dae9a]
-置換・検索・grep
--夏目漱石『行人』における「兄」の初出行
--夏目漱石『行人』における「母」の用例数
--太宰治『走れメロス』における「メロス」の用例数

***grep(複数のファイルを検索) [#kfb37c1d]

--夏目漱石の「飲む」
--太宰治の「飛べ」

***テキストファイルと拡張子 [#c15ea011]
-TXTファイル
-CSVファイル

***grepと置換でCSVファイルを作る(簡易版) [#u3ab2d6f]
-CSVファイルとは:テキストファイルで表を表現する
[[用語:CSVファイル>http://www.microsoft.com/japan/Terminology/query.asp?id=3334&q=CSV&kbid=&key=&ui=L&dev=]]
-KWIC:KeyWord In Context

-参考:[[grepと置換でKWICを作る>授業資料/grepと置換でKWICを作る]]

***メタ文字 ― ワイルドカードと正規表現 [#d0de5e25]
-''ワイルドカード'' [[>用語>http://e-words.jp/w/E383AFE382A4E383ABE38389E382ABE383BCE38389.html]]  cf.トランプのJoker
--主にファイル名の指定で使う
--文字を表すための文字(メタ文字) ?と* ((ワイルドカードの「?」「*」は、後で説明する正規表現の「?」「*」とは意味が違うので注意。ワイルドカードの「?」は正規表現で「.」、「*」は「.*」。))

|?|任意の1文字|
|*|任意の長さの文字列|

-''正規表現'' [[>用語>http://e-words.jp/w/E6ADA3E8A68FE8A1A8E78FBE.html]]
--文字を表すための特殊な文字(メタ文字)
--置換・検索・grepで利用できる
--すべて半角
--特殊文字そのものを表す場合には\でエスケープする(例:1\+2)

-[[授業資料/正規表現]]

***解凍用ソフト [#ve477f0c]
http://park8.wakwak.com/~app/Lhaca/

**第3回 10/6 テキストエディタの基礎 [#k1aa72b4]
-テキストエディタの設定
--行の折り返し
--行番号表示
---スタイル行番号(ワープロ的行番号)と論理行番号(エディタ的行番号)

-[[授業資料/K2Editorの使い方>授業資料#bf35bd53]]
-検索・置換、grep
-[[授業資料/覚えておきたいショートカットキー]]

**第2回 9/29 テキストデータとテキストエディタ [#g53e1e46]

-授業ページへのショートカット

***テキストデータ [#wee47413]

テキストデータ≒テキストファイル≒電子化テキスト

-テキストデータとはどんなものか
--[[授業資料/テキストデータとは]]
--[[授業資料/テキストデータ紹介]]

***テキストエディタ [#q7ae852c]
-テキストエディタとはどんなものか
--[[授業資料/テキストエディタ]]

-テキストエディタのダウンロードとインストール
--[[K2Editor>http://k2top.jpn.org/]] http://k2top.jpn.org/
-圧縮ファイルの展開(解凍)
--圧縮・展開ソフト(アーカイバ [[用語>http://e-words.jp/w/E382A2E383BCE382ABE382A4E38390.html]])
--zip,lzh形式
--+Lhaca


**第1回 9/22 イントロダクション [#t3a60d7a]
-自己紹介
-この授業の目的
-授業の進め方
-評価方法

***授業で使用する主なソフトウェア [#i06478d2]
|''K2Editor''|テキストエディタ|検索・整形|
|''ひまわり''|全文検索ソフト|検索・分析|
|''Excel''|表計算ソフト|分析・グラフ作成|

-用例検索・整理のデモ

//小森昌人 l052050

//欅祭委員会
// 16:40~17:15
// 9/29,10/27,11/17,12/1

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS