[[ソフトウェア/UniDic]]
*ubuntuでUniDic [#qd254943]
-[[ubuntu>http://www.ubuntulinux.jp/]](8.04LTS)でUniDicを使えるようにする手順(ソースからインストールする)(2008-12-04)
-UniDic 1.3.9用
**0.準備 [#za34392f]
-[[gccなど必要なもの>http://packages.ubuntu.com/ja/dapper/build-essential]]を入れておく。
$ sudo apt-get install build-essential
**1.解析器のインストール [#ua462610]
ChaSenかMeCabどちらかだけでもok。
***1.1 MeCabのインストール [#h5dcf213]
-http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=204917
$ tar -xzf mecab-0.97.tar.gz
$ cd mecab-0.97
$ ./configure --with-charset=utf8
$ make
$ make check
$ sudo make install
-必要ならmecab用IPADICもインストール(UniDicを使うだけなら要らない)
--http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205275
$ tar -xzf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801/
$ ./configure
$ make
$ sudo make install
***1.2 ChaSenのインストール [#ld38e5d1]
-[[darts>http://chasen.org/~taku/software/darts/]]のインストール
--http://chasen.org/~taku/software/darts/src/darts-0.32.tar.gz
$ tar -xzf darts-0.32.tar.gz
$ cd darts-0.32/
$ ./configure
$ make
$ sudo make install
+ChaSen本体のインストール
--http://sourceforge.jp/projects/chasen-legacy/downloads/32224/chasen-2.4.4.tar.gz
$ tar -xzf chasen-2.4.4.tar.gz
$ cd chasen-2.4.4/
$ ./configure
$ make
$ sudo make install
--必要ならchasen用NAIST-jdic(IPADIC)もインストール(UniDicだけを使うなら要らない)
---http://sourceforge.jp/projects/ipadic/
---http://sourceforge.jp/projects/naist-jdic/
---''IPADICをインストール''(任意)
---http://sourceforge.jp/projects/ipadic/downloads/24435/ipadic-2.7.0.tar.gz
$ tar -xzf ipadic-2.7.0.tar.gz
$ cd ipadic-2.7.0/
$ ./configure
$ make
$ sudo make install
---''またはNAIST-jdicをインストール''(任意)
---http://sourceforge.jp/projects/naist-jdic/downloads/31880/naist-jdic-0.4.3.tar.gz
$ tar -xzf naist-jdic-0.4.3.tar.gz
$ cd naist-jdic-0.4.3/
$ ./configure
$ make
$ sudo make install
***1.3 ライブラリのパスの更新 [#i6347597]
$ sudo gedit /etc/ld.so.conf
最終行に次を追加
/usr/local/lib
**2. UniDicをインストール [#d75075ac]
+http://download.unidic.org/ へいって、ユーザ登録。
+ダウンロードページの「キャビネット」というところの「1.3.9パッケージ」をクリック、そこにあるunidic-1.3.9-pkg.tar.gzをクリックしてダウンロード。
$ tar -xzf unidic-1.3.9-pkg.tar.gz
$ cd unidic-1.3.9-pkg/
$ ./configure
$ make
$ sudo make install
**3.UniDicを使って解析 [#kdc659bf]
-MeCabの場合
$ mecab -d /usr/local/unidic/dic/unidic-mecab FILE
-ChaSenの場合
--UniDic標準のXMLタグ形式で出力する場合
$ chasen -i w -r /usr/local/unidic/dic/unidic-chasen FILE
--表形式テキストで出力する場合(UniDicパッケージ付属のchauniを利用)
$ cd /usr/local/unidic/
$ ./chauni -t FILE
-chauniのオプション
usage: chauni [Options] file ...
where Options are
-c: Use chasen for morphological analysis [default=yes]
-m: Use mecab for morphological analysis [default=no]
-z: Use han2zen (unavailable with mecab) [default=no]
-n: Use numtrans (unavailable with mecab) [default=no]
-p: Use chaone (unavailable with mecab) [default=no]
-t: Use xml2txt (unavailable with mecab) [default=no]
-a: Use all of z, n, p, and t
#counter