用xunsearch做了个小搜索引擎,今天录入一个一句话,有个词没分出来,可能是默认词库里没有,于是想自己自定义词库,去官网看看,有教程,这里就记录一下过程吧,迅搜在自定义词库上搞的还是挺方便的,我只有几千条数据,反正就是玩玩嘛!
我的迅搜安装目录:/usr/local/xunsearch
下面记录步骤:
1.进入词库目录,使用vi打开自定义词库文件
cd /usr/local/xunsearch/etc/
vi dict_user.txt
2.文件中有说明,直接输入你要添加的词就行
TF和IDF值可以使用下面工具计算:http://www.xunsearch.com/scws/demo/get_tfidf.php
词性(ATTR)可参考如下表:http://unun.in/sql/145.html
/usr/local/xunsearch/bin/xs-ctl.sh -b inet -s search restart
然后你再录入的就会被使用这个词分,原来已经录入的,那就只能重做索引啦!