linux安装日文分词(mecab)
今天公司同事居然让我在php上安装个mecab来支持日文分词,当时我就蒙了,这个东西是撒,从来没有听说过,网上google了下,发现mecab是基于CRF的一个日文分词系统,代码使用c++实现,基本上内嵌了 CRF++的代码,同时提供了多种脚本语言调用的接口(python,perl,ruby 等).好了,大致的了解下就够了,下面来开始安装.
系统:centos 5.5
系统环境:lamp
需要的软件包:mecab-0.98.tar.gz mecab-ipadic-2.7.0-20070801.tar.gz php-mecab-0.5.0.tgz
1.安装前准备
这里我的php版本是5.3.8,如图
wget http://mecab.googlecode.com/files/mecab-0.98.tar.gz wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz wget http://cloud.github.com/downloads/rsky/php-mecab/php-mecab-0.5.0.tgz
下载完后解压,然后先安装mecab,再安装mecab-ipadic,最后安装php-mecab
tar zxf mecab-0.98.tar.gz
tar zxf mecab-ipadic-2.7.0-20070801.tar.gz
tar zxf php-mecab-0.5.0.tgz
2.安装mecab
cd mecab-0.98
./configure
make && make install
3.安装mecab-ipadic
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8 --enable-mutex
make
make install
4.安装php-mecab
cd php-mecab-0.5.0
/usr/local/php/bin/phpize Configuring for: PHP Api Version: 20090626 Zend Module Api No: 20090626 Zend Extension Api No: 220090626
./configure --with-php-config=/usr/local/php/bin/php-config --with-mecab=/usr/local/bin/mecab-config make make install Installing shared extensions: /usr/local/php/lib/php/extensions/no-debug-non-zts-20090626/
上面是php-mecab.so的路径.
cd /etc/php.d/
vi mecab.ini
mecab.ini里的内容:
extension=/usr/local/php/lib/php/extensions/no-debug-non-zts-20090626/mecab.so
然后重启apache:
service httpd restart
下图是我在浏览器上截的:
大家可以看到mecab已经整合到php上了,好了,就到这里.
评论: