Lucene5.x 集成中文分词库Ansj

 2019 年 4 月 2 日    943    3

Ansj中文分词是一个基于n-Gram+CRF+HMM的中文分词的java实现,分词速度达到每秒钟大约200万字左右,准确率能达到96%以上,目前实现了.中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能。

Read More >