MeCabのインストール

さくらVPS・CentOS 7の環境でのMeCabのインストール方法です

公式サイト通りにインストールしたところ文字化けしていましました。

この場合、MeCabとmecab-ipadic(辞書)のアンインストールと、展開したディレクトリを削除してやり直します。

アンインストール


cd mecab-ipadic-2.7.0-20070801

make uninstall #辞書のアンインストール


cd mecab-0.996

make uninstall #MeCabのアンインストール

中身のファイルごとディレクトリを削除


rm -rf ディレクトリ名

Mecabファイルのダウンロード

私は公式ページからローカルにダウンロードし、VPSにアップロードしました。

 
下記はwgetを使う場合です


wget -O mecab-0.996.tar.gz "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE"

 
参考

Mecabの展開・インストール


tar -xvf mecab-0.996.tar.gz

cd mecab-0.996

./configure --with-charset=utf-8 --enable-utf8-only

make

make chack

make install

途中で To enable dictionary, rewrite /usr/local/etc/mecabrc as “dicdir = /usr/local/lib/mecab/dic/naist-jdic” と出ますが、何もする必要はありません。

Mecab辞書ファイルのダウンロード

同じく下記はwgetを使う場合です


wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz

辞書ファイルをUTF-8へ


tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz

cd mecab-ipadic-2.7.0-20070801

nkf -w --overwrite *.csv

nkf -w --overwrite *.def


vi dicrc

# config-charset = EUC-JP を config-charset = UTF-8 へ変更

 
参考

辞書のインストール


./configure

make

make install

mecabの実行


# macab

すもももももももものうちすもももももももものうち

すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウ

実行時のエラー

error while loading shared libraries: libmecab.so.2: cannot open shared object file: No such file or directoryとでた場合

システム全体が/usr/local/libを参照できる様に、任意の名前のconfファイルを設置します


cd /etc/ld.so.conf.d

vi hoge.conf

 
参考

その他

mecabrc(設定ファイル)の場所 /usr/local/etc/

MeCab

Posted by iser