linux安装日文分词(mecab)

post by rocdk890 / 2012-5-26 11:53 Saturday linux技术
  今天公司同事居然让我在php上安装个mecab来支持日文分词,当时我就蒙了,这个东西是撒,从来没有听说过,网上google了下,发现mecab是基于CRF的一个日文分词系统,代码使用c++实现,基本上内嵌了 CRF++的代码,同时提供了多种脚本语言调用的接口(python,perl,ruby 等).好了,大致的了解下就够了,下面来开始安装.
   系统:centos 5.5
   系统环境:lamp
   需要的软件包:mecab-0.98.tar.gz mecab-ipadic-2.7.0-20070801.tar.gz php-mecab-0.5.0.tgz
1.安装前准备
这里我的php版本是5.3.8,如图
点击查看原图
wget http://mecab.googlecode.com/files/mecab-0.98.tar.gz
wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
wget http://cloud.github.com/downloads/rsky/php-mecab/php-mecab-0.5.0.tgz
下载完后解压,然后先安装mecab,再安装mecab-ipadic,最后安装php-mecab
tar zxf mecab-0.98.tar.gz
tar zxf mecab-ipadic-2.7.0-20070801.tar.gz
tar zxf php-mecab-0.5.0.tgz
2.安装mecab
cd mecab-0.98
./configure
make && make install
3.安装mecab-ipadic
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8 --enable-mutex
make 
make install
4.安装php-mecab
cd php-mecab-0.5.0
/usr/local/php/bin/phpize
Configuring for:
PHP Api Version:         20090626
Zend Module Api No:      20090626
Zend Extension Api No:   220090626
./configure --with-php-config=/usr/local/php/bin/php-config --with-mecab=/usr/local/bin/mecab-config
make 
make install
Installing shared extensions:     /usr/local/php/lib/php/extensions/no-debug-non-zts-20090626/
点击查看原图
上面是php-mecab.so的路径.
cd /etc/php.d/
vi mecab.ini
mecab.ini里的内容:
extension=/usr/local/php/lib/php/extensions/no-debug-non-zts-20090626/mecab.so
然后重启apache:
service httpd restart
下图是我在浏览器上截的:
点击查看原图
大家可以看到mecab已经整合到php上了,好了,就到这里.
夜空- 本站版权
1、本站所有主题由该文章作者发表,该文章作者与夜空享有文章相关版权
2、其他单位或个人使用、转载或引用本文时必须同时征得该文章作者和夜空的同意
3、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
4、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
5、原文链接:blog.slogra.com/post-203.html

标签: centos mecab php-mecab 日文分词

  1. 2016-01-19 11:21
    @chenBY:因为网上有很多教程,所以我推授你可以看看网上其他blog的,比如http://chain.logdown.com/post/179276-mecab-solve-kanji-sort-problem或http://www.52nlp.cn/%E7%94%A8mecab%E6%89%93%E9%80%A0%E4%B8%80%E5%A5%97%E5%AE%9E%E7%94%A8%E7%9A%84%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%E7%B3%BB%E7%BB%9F%E4%B8%89%EF%BC%9Amecab-chinese
  1. gravatar chenBY
    2016-01-15 21:39
    你好,请问可以讲讲如何使用mecab进行日语分词吗?
  1. 2012-06-15 11:41
    @小白兔:不好意思,我不会,我都还在学习中.
  1. gravatar 小白兔
    2012-06-14 18:33
    请问你会使用mecab进行日语分词吗?
  1. gravatar 象牙塔
    2012-05-29 08:49
    对了,你的标签云好壮观啊,黑压压一片~
  1. 2012-05-27 10:35
    @象牙塔:不算高手啦:)
  1. gravatar 象牙塔
    2012-05-27 08:46
    Linux高手啊,给力!

评论: