日本言語研究(講義)

コーパス日本語学入門

2011/06/24 (10) 形態素解析

2011/06/17 (9) 「ひまわり」の検索結果の集計2

復習

文字列関数

エディタの応用

応用・意味に関わる分析

相対頻度の計算

2011/06/10 (8) 「ひまわり」の検索結果の集計 / 正規表現小テスト

Excel

teki.png

「ひまわり」用追加データ

正規表現小テスト

2011/06/03 (7) 全文検索システム「ひまわり」

「ひまわり」とは

ひまわりとデータのセットアップ

ひまわりと正規表現

検索とExcelでの集計デモ

2011/05/27 (6) タグ付き正規表現

最長一致の原則(greedy matching)と最小一致

後方参照

テキストデータのダウンロード

2011/05/20 (5) 正規表現を使う

正規表現とは

正規表現の応用

#amazon(4873111706) #amazon(4873113598)

2011/05/13 (4) テキストエディタと正規表現

復習

ショートカットキー

grepと置換で簡易KWIC(CSVファイル)を作る

正規表現

正規表現を使ってみる

2011/05/06 (3) テキストエディタ

テキストエディタ

テキストエディタの利用

2011/04/22 (2) テキストファイルとテキストエディタ

先週の補足

狭義のコーパス
言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
広義のコーパス
コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。

授業で利用する主なソフトウェア

テキストエディタ検索・整形
全文検索ソフトひまわり検索・分析
表計算ソフトExcel分析・グラフ作成
ワープロWord「スタイル」を利用したレポート作成

テキストデータ

2011/04/15 (1) イントロダクション


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS