成蹊2013

2014/1/10

レポート作成のためのコーパス検索・調査(2)

Wordを使ってレポートを書く

2013/12/20

2013/12/13

補足

レポート作成のためのコーパス検索・調査(1)

2013/12/06

BCCWJ利用の落とし穴

調整頻度の計算

ランダムサンプリング調査(Excelでの集計・補足)

NINJAL LWP for BCCWJの紹介

2013/11/29

検索の例つづき

形態素解析とUniDic


形態素解析:「Mecab」と「UniDic」

形態素解析とは

どんなものか



morph.png

形態素解析用ソフトウェア

以前から使われているソフトウェア

UniDicの特長

  1. 見出し語が短単位という斉一な単位に揃えられている
  2. 見出し語が階層化されており表記の揺れや語形の変異にかかわらず同一の見出しを与えることができる
  3. アクセントや音変化の情報を付与することができる
  4. 語種など言語研究のための豊富な情報が付与されている

比較的新しい形態素解析器

形態素解析に関する専門書

(参考)長単位解析器

※BCCWJの長単位を付けるのに使われた。短単位を組み上げて品詞を長単位規定に合わせることができる

(参考)係り受け解析器

※BCCWJには係り受け情報は付いていない。NWJCは自動解析した係り受け情報付き


授業用UniDic+MeCabパッケージのダウンロード

茶まめで形態素解析・Excelで集計

  1. 茶まめで解析してみる(解析器はMeCab+解析辞書はUniDic)
  2. Excelに出力する
  3. ピボットテーブルで集計する

レポートテーマについて

表記

類義語・対義語

語形、語法

新語・意味変化

2013/11/22

復習

  1. 「中納言」による検索
  2. Excelでインポート
  3. ピボットテーブルで集計

Excelの基礎

検索の例

補足

2013/11/08

検索条件式

キー: 語彙素 = "奇麗" IN core="true" WITH OPTIONS unit="1" AND tglWords="20" AND tglKugiri="|" AND tglFixVariable="2"

検索結果をExcelで利用する

「中納言」検索結果のダウンロードとExcelでの利用

  1. ダウンロード
  2. アーカイブの展開(解凍)
  3. Excelでインポート

【重要】ピボットテーブルの使い方

2013/11/01

コーパスの形態論情報

学校文法との違い

見出し語の階層構造

形態論情報を活かした検索

2013/10/25

日本語コーパスの紹介(2) コーパスの設計とサンプリング

2013/10/11

日本語コーパスの紹介(1)コーパスとはどんなものか

狭義のコーパス
言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
広義のコーパス
コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。

2013/10/04

「中納言」利用申込み

現代日本語書き言葉均衡コーパス(BCCWJ)とは

「中納言」を使ってみる

2013/09/27

イントロダクション


*1 最新版はMeCab版のみ
*2 現在では動かすのがたいへん

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS