成蹊2011
2011/05/06 日本語コーパスの紹介(2)
- (スライド参照)IT's Class >日本語学講義E>教材>スライド>5月6日サンプリング・著作権処理・文字コード
均衡コーパスとサンプリング
- 「バランスがとれている」とは?
- コーパスの母集団とサンプリング
- 著作権処理
日本語の文字コードとコーパス
- 文字化けのいろいろ
- 文字集合と文字符号化方式
- 包摂規準
2011/04/29 日本語コーパスの紹介(1)
コーパスとはどんなものか
- (スライド参照): IT's Class >日本語学講義E>教材>スライド>4月29日コーパスとは
- 狭義のコーパス
- 言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
- 広義のコーパス
- コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。
- この授業で扱うのは狭義のコーパス。中でも「現代日本語書き言葉均衡コーパス(BCCWJ)」
- もうひとつの授業「日本語日本文学のためのコンピュータ」で扱っているデータは後者
2011/04/22 イントロダクション