阪大2013
をテンプレートにして作成
開始行:
[[FrontPage]]
*2013大阪大学 集中講義・国語史講義
**レポートについて
-''2014年1月31日までに ogiso◎ogiso.net 宛にメールに添付し...
--レポートのファイルサイズが大きい場合にはPDFファイルにし...
--受け取り後、必ず確認の返信をします。2日経っても返信がな...
**予定
***[[12/17>阪大2013/12月17日]]
-はじめに
-総索引から電子化テキストへ(国語史資料の電子化の歴史)
-テキストデータと文字コード
-テキストエディタの利用
--正規表現
--タグ付き正規表現
***[[12/18>阪大2013/12月18日]]
-構造化文書
-(太陽コーパス)・近代女性雑誌コーパス
-全文検索システム ひまわり
--ひまわりの使い方
--Excelによる集計(ピボットテーブル)
-えだまめによるミニコーパス作成
-形態素解析
--MeCabとUniDic
--歴史的資料を対象としたUniDic
--UniDicの見出し語構造
-茶まめで形態素解析
--テキストの語種構成比較
//-形態素解析結果をもとに索引を作る
***[[12/19>阪大2013/12月19日]](午後から)
-形態論情報付きのコーパス
--明六雑誌コーパス
//--国定高等小学読本コーパス
-日本語歴史コーパス(CHJ)
--アカウント作成
-日本語歴史コーパス(CHJ)を使う
--CHJについて
--中納言の使い方
--短単位について
-Excelでの集計・応用
***[[12/20>阪大2013/12月20日]]
-現代日本語書き言葉均衡コーパス(BCCWJ)
--少納言
-コーパス管理ツール「茶器」
--形態素解析とインポート
-コーパスを利用した研究例
-近代編
--形容動詞連体形の話
---クラスター分析
---S字カーブ(ロジスティック回帰)
-中古編
--地の文・会話文・歌ごとの語彙の位相差の話
---特徴語抽出(対数尤度比 LLR) cf.宮島・近藤
--「~なし」がどこまで一語かという話(須永)
---コロケーション強度(Tスコア)
**シラバス
***講義題目:コーパスに基づく日本語史研究
***授業の目的:
内省に頼ることができない日本語史の研究において、残された...
***講義内容:
近年、現代語の大規模コーパスの公開に続き、古い時代の日本...
本講義では、テキストデータとコーパスに関する基礎知識、日...
最後に、受講者各自の関心に基づき、コーパスを活用した研究...
***授業計画:
下記のテーマについて講義する。
-日本語史研究とコーパス
-コーパスとテキストデータの基礎知識
--テキストデータ
--構造化文書
--形態論情報付きのコーパス
-日本語史研究に利用できるデータ紹介
--テキストアーカイブ
--近代雑誌コーパス
--日本語歴史コーパス
-コーパス活用のためのツール
--全文検索システム「ひまわり」
--コーパス検索ツール「中納言」
--古文の形態素解析
--コーパス管理ツール「茶器」
--表計算ソフトによる集計
-コーパスの活用例
--近代語編
--中古和文編
***その他
-教科書:教科書は使用しない。教材は原則としてWebページの...
-参考文献:授業時に指示する
-成績評価:レポートで評価する
-キーワード:日本語史 コーパス テキスト処理 形態素解析
-受講生へのメッセージ:授業でPCを使用して実際にコーパスを...
終了行:
[[FrontPage]]
*2013大阪大学 集中講義・国語史講義
**レポートについて
-''2014年1月31日までに ogiso◎ogiso.net 宛にメールに添付し...
--レポートのファイルサイズが大きい場合にはPDFファイルにし...
--受け取り後、必ず確認の返信をします。2日経っても返信がな...
**予定
***[[12/17>阪大2013/12月17日]]
-はじめに
-総索引から電子化テキストへ(国語史資料の電子化の歴史)
-テキストデータと文字コード
-テキストエディタの利用
--正規表現
--タグ付き正規表現
***[[12/18>阪大2013/12月18日]]
-構造化文書
-(太陽コーパス)・近代女性雑誌コーパス
-全文検索システム ひまわり
--ひまわりの使い方
--Excelによる集計(ピボットテーブル)
-えだまめによるミニコーパス作成
-形態素解析
--MeCabとUniDic
--歴史的資料を対象としたUniDic
--UniDicの見出し語構造
-茶まめで形態素解析
--テキストの語種構成比較
//-形態素解析結果をもとに索引を作る
***[[12/19>阪大2013/12月19日]](午後から)
-形態論情報付きのコーパス
--明六雑誌コーパス
//--国定高等小学読本コーパス
-日本語歴史コーパス(CHJ)
--アカウント作成
-日本語歴史コーパス(CHJ)を使う
--CHJについて
--中納言の使い方
--短単位について
-Excelでの集計・応用
***[[12/20>阪大2013/12月20日]]
-現代日本語書き言葉均衡コーパス(BCCWJ)
--少納言
-コーパス管理ツール「茶器」
--形態素解析とインポート
-コーパスを利用した研究例
-近代編
--形容動詞連体形の話
---クラスター分析
---S字カーブ(ロジスティック回帰)
-中古編
--地の文・会話文・歌ごとの語彙の位相差の話
---特徴語抽出(対数尤度比 LLR) cf.宮島・近藤
--「~なし」がどこまで一語かという話(須永)
---コロケーション強度(Tスコア)
**シラバス
***講義題目:コーパスに基づく日本語史研究
***授業の目的:
内省に頼ることができない日本語史の研究において、残された...
***講義内容:
近年、現代語の大規模コーパスの公開に続き、古い時代の日本...
本講義では、テキストデータとコーパスに関する基礎知識、日...
最後に、受講者各自の関心に基づき、コーパスを活用した研究...
***授業計画:
下記のテーマについて講義する。
-日本語史研究とコーパス
-コーパスとテキストデータの基礎知識
--テキストデータ
--構造化文書
--形態論情報付きのコーパス
-日本語史研究に利用できるデータ紹介
--テキストアーカイブ
--近代雑誌コーパス
--日本語歴史コーパス
-コーパス活用のためのツール
--全文検索システム「ひまわり」
--コーパス検索ツール「中納言」
--古文の形態素解析
--コーパス管理ツール「茶器」
--表計算ソフトによる集計
-コーパスの活用例
--近代語編
--中古和文編
***その他
-教科書:教科書は使用しない。教材は原則としてWebページの...
-参考文献:授業時に指示する
-成績評価:レポートで評価する
-キーワード:日本語史 コーパス テキスト処理 形態素解析
-受講生へのメッセージ:授業でPCを使用して実際にコーパスを...
ページ名: