MeCabのインストール

さくらVPS・CentOS 7の環境でのMeCabのインストール方法です

公式サイト通りにインストールしたところ文字化けしていましました。

この場合、MeCabとmecab-ipadic(辞書)のアンインストールと、展開したディレクトリを削除してやり直します。

アンインストール

[code lang=”python” title=””]

cd mecab-ipadic-2.7.0-20070801

make uninstall #辞書のアンインストール

cd mecab-0.996

make uninstall #MeCabのアンインストール

[/code]

中身のファイルごとディレクトリを削除

[code lang=”python” title=””]

rm -rf ディレクトリ名

[/code]

Mecabファイルのダウンロード

私は公式ページからローカルにダウンロードし、VPSにアップロードしました。

 
下記はwgetを使う場合です

[code lang=”python” title=””]

wget -O mecab-0.996.tar.gz "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE"

[/code]
 
参考

Mecabの展開・インストール

[code lang=”python” title=””]

tar -xvf mecab-0.996.tar.gz

cd mecab-0.996

./configure –with-charset=utf-8 –enable-utf8-only

make

make chack

make install

[/code]
途中で To enable dictionary, rewrite /usr/local/etc/mecabrc as “dicdir = /usr/local/lib/mecab/dic/naist-jdic” と出ますが、何もする必要はありません。

Mecab辞書ファイルのダウンロード

同じく下記はwgetを使う場合です

[code lang=”python” title=””]

wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz

[/code]

辞書ファイルをUTF-8へ

[code lang=”python” title=””]

tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz

cd mecab-ipadic-2.7.0-20070801

nkf -w –overwrite *.csv

nkf -w –overwrite *.def

vi dicrc

# config-charset = EUC-JP を config-charset = UTF-8 へ変更

[/code]

 
参考

辞書のインストール

[code lang=”python” title=””]

./configure

make

make install

[/code]

mecabの実行

[code lang=”python” title=””]

# macab

すもももももももものうちすもももももももものうち

すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウ

[/code]

実行時のエラー

error while loading shared libraries: libmecab.so.2: cannot open shared object file: No such file or directoryとでた場合

システム全体が/usr/local/libを参照できる様に、任意の名前のconfファイルを設置します

[code lang=”python” title=””]

cd /etc/ld.so.conf.d

vi hoge.conf

[/code]
 
参考

その他

mecabrc(設定ファイル)の場所 /usr/local/etc/

MeCab

Posted by iser