成蹊2009
日本語学講義B(後期)†
お知らせ
- Web Collaborationで形態素解析用のソフトウェアを配布しています。自分のUSBメモリにコピーして使ってください。(空き容量が約400MB必要です)
- 出席について:情報教育用施設の出席管理システムで毎回確認しています。
- 授業中に案内したアカウントでコーパス検索ツール:中納言が使えます。詳しい使い方は授業終盤で説明しますが、レポートテーマの検討のためあらかじめ利用してみてください。
12/07 第8回 形態素解析結果をデータベースで扱う(Access)
- データベースに取り込む:
- Accessで新規データベースを作成(mdbファイル)
- インポート
- 連番を付ける
- 連続する形態素を取り出す・集計する
- 次の形態素の連番を付ける
- 列を用意する
- 更新クエリ
- 連続する形態素を抜き出す
- 解析結果テーブル自身をずらして結合する
- 前後の形態素で条件指定した選択クエリ
参考資料:形態素解析結果をAccessで使う(PDF)
11/30 第8回 形態素解析結果の集計(Excel)(2)
- 前回収集したデータを茶まめ(UniDic+MeCab)で解析し、Excelで集計します。
- Excelのピボットテーブルが使いこなせるようになってください。
- 茶まめの使い方(復習)
- Excelとピボットテーブル
11/16 第7回 形態素解析結果の集計
- 今回から実習的な内容が多くなります。
- 茶まめ(UniDic+MeCab)で解析した結果をExcelで集計します。
- 自分で形態素解析が行えるようにしてください。
- 茶まめの使い方
- Excelとピボットテーブル
11/09 第6回 形態素解析
- 形態素解析とは
- UniDicの概要
- 茶まめで形態素解析を行う
- 配付資料:小木曽(2007)「日本語研究と自動形態素解析」
11/02 第5回 文字コード
- 文字の符号化と文字集合
- 形態素解析用ソフトウェア(配布と動作確認)
10/26 第4回 コーパスのデータ形式
10/19 第3回 均衡コーパス
10/12(体育の日・開講日) 休講
10/5 第2回 利用可能な言語資源とコーパス
- 前回補足
- 形態素解析のデモンストレーション(兼 環境チェック)
(以下パワーポイント参照)
- 紙の資料からコーパスまで
- コーパスとは
- 広義のコーパス/狭義のコーパス
- コーパス,テキストデータの紹介
9/28 第1回 ガイダンス