Solr中文分词

ilrxx

浏览: 62801 次
性别:
来自: 北京

最近访客更多访客>>

zoulei

winnerq

zwd_18776156173

quhaobo11

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (34)

社区版块

存档分类

Solr json XML Blog HTML

大家在solr中运用中文分词器进行查询可能都遇到过一个问题，就是不管你用哪种中文分词器，在solr中配置好后，发现利用solr提供的analysis页面中可以看到中文分词效果，solr也按照分词后的结果创建了索引，但是在solr中就是查询不到结果，在网上也找了很多资料，都没有解决，后来我发现我进入了一个误区，其实solr的analysis只是提供查看分词效果的，但是你想简单通过几个中文分词的配置就实现在solr中的搜索是不行的，这个还是要自己在代码中处理的。现在我的处理方法是这样的，先看下这个帖子http://blog.chenlb.com/2010/08/get-solr-analysis-word.html.通过这个url可以去查询到分词后的结果，你可以让他显示成json或者xml格式（可以针对自己solr配置的路径去修改这个url），然后写个工具类去解析它，获得中文分词结果，到此距离成功还有一步之遥，但是这一步又有一个问题产生，假设一开始搜索“联想中国”没有搜索到结果，但是人为的加上空格变为“联想中国”去搜索就有结果了，有人说solr中空格后默认加上的是“OR”，所以可以查询到，但是我在实际中试过，如果分词全用空格去拼接，有的可以搜索到，有的还是不行（但是比一开始什么都搜不到又进一步，因为这里在代码中又处理了分词），所以想到最后解决方案是所有的分词全用”OR“去拼接，这下可以搜到结果了，如果大家有好的建议，可以提给我，谢谢大家。

0
顶

0
踩

分享到：

memcached服务端使用经验 | memcached实现数据轮询展现

2011-01-17 10:14
浏览 3201
评论(2)
分类:编程语言
查看更多

2 楼 ilrxx 2011-08-25

黎明lm 写道

能否详细的说名下呢我也遇到了这个问题多谢就是配置了IK后：
页面分词测试的时候就报：
org.wltea.analyzer.solr.IKTokenizerFactory null
后面是null
分词无结果

请指教下

仔细看这篇文章：http://blog.chenlb.com/2010/08/get-solr-analysis-word.html

1 楼黎明lm 2011-08-25

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论