coreseek是一款基于sphinx开源的搜索引擎,因为sphinx只支持英文和俄文(即只能进行英文分词和俄文分词),所以如果要使用sphinx做中文搜索的话,需要自己独立去导入中文词库。而coreseek里集成了中文词库模块mmseg,所以直接使用coreseek会方便很多。本文地址:http://www.04007.cn/article/265.html,未经许可,不得转载.
Coreseek目前的最新版是coreseek4.1版本,2011年发布的,是基于Sphinx2.0.2的,早先有一个版本coreseek3.2.14版,2010年发布的,其中的Sphinx是0.9.9版。看版本号也能看到两者变化很大,2.0.2版性能更好。所以建议使用coreseek4.1版。本文地址:http://www.04007.cn/article/265.html,未经许可,不得转载.
自测安装脚本如下:本文地址:http://www.04007.cn/article/265.html,未经许可,不得转载.
#下载coreseek4.1版 wget http://files.opstool.com/man/coreseek-4.1-beta.tar.gz tar zxvf coreseek-4.1-beta.tar.gz cd coreseek-4.1-beta cat README.txt #readme写得很详细, #安装中文分词 cd mmseg-3.2.14 ./bootstrap ./configure --prefix=/opt/modules/mmseg3 make && make install #安装coreseek cd csft-4.1/ ./buildconf.sh ./configure --prefix=/opt/modules/coreseek4.1 --without-unixodbc --with-mmseg --with-mmseg-includes=/opt/modules/mmseg3/include/mmseg/ --with-mmseg-libs=/opt/modules/mmseg3/lib/ --with-mysql make make install强烈建议一定要好好看看README文件和里面的测试用例,作者还是非常费心的。非常完善,目前coreseek的官方网站因备案问题打不开。本文地址:http://www.04007.cn/article/265.html,未经许可,不得转载.
目录说明: csft-x.y.z:coreseek源代码 mmseg-i.j.k:mmseg源代码 testpack:测试配置和数据包 testpack测试说明: 目录说明: api:api接口和测试脚本 etc:配置文件 etc/pysource:python数据源脚本 var:运行数据 var/data:索引文件 var/log:搜索日志 var/test:测试源数据 配置1: 测试对象:xml数据源,中文分词与搜索 对应配置:etc/csft.conf 测试数据:var/test/test.xml PHP程序:api/test_coreseek.php 配置2: 测试对象:xml数据源,单字切分与搜索 对应配置:etc/csft_cjk.conf 测试数据:var/test/test.xml PHP程序:api/test_coreseek.php 配置3: 测试对象:mysql数据源,中文分词与搜索 对应配置:etc/csft_mysql.conf 测试数据:var/test/documents.sql PHP程序:api/test_coreseek.php 测试说明:请先将测试数据导入数据库,并设置好配置文件中的MySQL用户密码数据库 配置4: 测试对象:python数据源,中文分词与搜索 对应配置:etc/csft_demo_python.conf 数据脚本:etc/pysource/csft_demo/__init__.py PHP程序:api/test_coreseek.php 测试说明:请先安装Python 2.6 (x86) 配置5: 测试对象:python+mssql数据源,中文分词与搜索 对应配置:etc/csft_demo_python_pymssql.conf 数据脚本:etc/pysource/csft_demo_pymssql/__init__.py PHP程序:api/test_coreseek.php 测试说明:请先安装Python 2.6 (x86)、pymssql(py2.6) coreseek-4.y.z测试: 配置6: 测试对象:RT实时索引,中文分词与搜索 对应配置:etc/csft_rtindex.conf PHP程序:api/test_coreseek_rtindex.php 配置7: 测试对象:RT实时索引,单字切分与搜索 对应配置:etc/csft_rtindex_cjk.conf PHP程序:api/test_coreseek_rtindex.php本文地址:http://www.04007.cn/article/265.html,未经许可,不得转载.
本文地址:http://www.04007.cn/article/265.html 未经许可,不得转载. 手机访问本页请扫描右下方二维码.
![]() |
![]() |
手机扫码直接打开本页面 |