Lucene5.x 集成中文分词库Ansj

 2019 年 4 月 2 日    943    3

Ansj中文分词是一个基于n-Gram+CRF+HMM的中文分词的java实现,分词速度达到每秒钟大约200万字左右,准确率能达到96%以上,目前实现了.中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能。

Read More >

IKAnalyzer词典扩充

 2019 年 3 月 28 日    545    0

最近做博客搜索功能的时候使用Lucene+IK进行实现,在使用的过程中发现`小程序`这三个字都无法搜索出来,于是就需要对Ik的词典进行扩充了。

Read More >

Lucene5.x索引操作工具类封装

 2019 年 3 月 26 日    575    0

基于Lucene5.x封装的工具类,分词器使用IKAnalyzer。

Read More >

Lucene5.x 集成中文分词库 IKAnalyzer

 2019 年 3 月 25 日    276    0

IKAnalyzer目前最新版本只支持到lucene4.x,所以我们在使用的时候需要修改一下IKanalyzer的源码,让它支持lucene5.x版本。

Read More >

Lucene几种查询方式

 2019 年 3 月 25 日    283    0

Lucene的查询方式很丰富,对于数值类型的数据,采取TermRangeQuery的方式,对于String类型的,就可以采取TermQuery等,查询方式了,可以通过采取合适的查询方式,检索到数据。Queryparser这个查询方式包含了其他几种查询方式。

Read More >