*成蹊2008後期 [#j7f1b7b2] **日本語学講義B:コーパス日本語学入門[#df3b5928] -コーパスとは何か、日本語をコンピュータで扱う場合の諸問題、コーパスの応用可能性について見ていきます。 -現在構築中の[[現代日本語書き言葉均衡コーパス>http://www2.kokken.go.jp/~kotonoha]]について紹介します。 *日本語学講義B [#aa6747c8] -科目名 日本語学講義B -教員名 小木曽 智信 -単位数 2 年次配当 2 開講時期 後期 //(15名) ***▼ テーマ・概要・目標 ▼ [#e7f4465e] 近年、コーパス言語学が注目を集めている。コーパスとはコンピュータに蓄えられた大規模な言語資料で、これを利用することでこれまで行うことのできなかった研究が可能になりつつある。特に英語学の分野での発達が著しいが、日本語学の分野でも今後の発展が期待される分野である。 この授業では、コーパスを代表とする日本語学とコンピュータが関わる分野を中心に講義を行う。文字コードや、資料の電子化や現在コンピュータで利用可能な国語資料、形態素解析システムなどについて解説する。さらに、現在構築が進みつつある本格的な日本語コーパスについて紹介する。 ***授業の計画 [#tdeadcf5] 以下の各テーマについて、それぞれ2~3回程度の授業を行う。 -新しい日本語コーパスの紹介 -電子化資料の現況 -国語資料の電子化と構造化文書 -文字コードの問題 -形態素解析の仕組みと使い方 -データベースによる形態素解析結果の利用 ***授業の方法 [#j240899e] スライドを用いた講義形式で行う。 一部、実際にパソコンを使った実習的な内容を含む。 ただし、受講者の人数によっては方法を変更する場合がある。 ***成績評価の方法 [#hb5ef9b5] 出席・期末テスト・小レポート等を総合して評価する。 ***必要な予備知識/先修科目/関連科目[#e18604de] 特になし。 ***テキスト [#ye88ab06] 特定の教科書は使用しない。Webページの形で提示するほか、必要に応じてプリントを配布する。 ***参考書 [#dc768f5b] 授業時に紹介する。 *各回の内容 [#ga954ff4] **2008/09/22 第1回:イントロダクション [#fccd3a94] -授業の目的 -進め方 //演習的要素を含める -評価 //*各回の内容 [#ga954ff4] //**2008/09/22 第1回:イントロダクション [#fccd3a94] //-授業の目的 //-進め方 ////演習的要素を含める //-評価