形態素解析エンジン「MeCab」をインストール

オープンソースの形態素解析エンジン「MeCab」をLinuxにインストールしたので、メモ。

実はyumでもインストールできるみたいなのですが、ソースからインストールすることにしました。

ちなみに、Mecabとは、

MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです. 言語, 辞書,コーパスに依存しない汎用的な設計を 基本方針としています. パラメータの推定に Conditional Random Fields (CRF) を用 いており, ChaSenが採用している 隠れマルコフモデルに比べ性能が向上しています。また、平均的に ChaSen, Juman, KAKASIより高速に動作します

というもの。

まずは、下記からUnix(Linux)用のソースファイルをダウンロードします。


まずは、MeCab本体をインストールします。
% tar zxfv mecab-X.X.tar.gz
% cd mecab-X.X
% ./configure
% make
% make check
% su
# make instal

次に、わかち書き用の辞書ファイルをインストールします。

ここで、うちのサーバーの環境はすべてUTF-8で統一しているので、辞書ファイルもUTF-8のみにすることにしました。

% tar zxfv mecab-ipadic-2.7.0-XXXX.tar.gz
% cd mecab-ipadic-2.7.0-XXXX
% ./configure --enable-utf8-only

次にmakeをしたら、以下のエラーが出てしまった。
/usr/local/libexec/mecab/mecab-dict-index: error while loading shared libraries: libmecab.so.1: cannot open shared object file: No such file or directory

なので、以下のコマンドで対処。
#ldconfig

参考URL:iTime » Blog Archive » 「error while loading shared libraries:」というエラーに遭遇!

で無事make完了!引き続きインストール。

% make
% su
# make install

これでインストール完了です。

さて、、、これでとあるサービスを作ってみようかな~~っと(^^;)