日本語学講義(I) 日本語コーパス研究入門†
- 授業に関するメールはこちらへ。
小木曽 智信: ogiso@ogiso.net ←@を半角に置き換えてください
- 授業フォルダ \\Linkstation\share\日本語コーパス
2012/10/12 コーパスとは
はじめに
- BCCWJ中納言の申し込み
- 授業フォルダの説明
- \\Linkstation\share\日本語コーパス
コーパスとは
- スライド参照
- コーパスとはどんなものか
- 日本語コーパス以外(以前)の電子資料
- 狭義のコーパス
- 言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
- 広義のコーパス
- コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。
「少納言」を使ってみる
参考リンク
コーパスの設計とサンプリング
- 「バランスがとれている」とは?
- 現代日本語の書き言葉の縮図としてのコーパスを作る
- コーパスの母集団の設定とサンプリング
- BCCWJのサブコーパス
- 可変長と固定長
2012/10/05 イントロダクション†
- デモンストレーション
- BCCWJ中納言+Excel
- 茶まめ(形態素解析)
- ひまわり
授業で利用する主なソフトウェア†