1.下载jieba分词包:
下载地址:http://download.csdn.net/detail/wbcg111/9685021
2.配置,使用分词包
- com.huaban.analysis.jieba和com.huaban.analysis.jieba.viterbi放到src目录下
- dict.txt、jieba.java.code.style.xml和prob_emit.txt放到src目录下
- 新建如下文件:
public static void main(String[] args) throws IOException {
String text = "前任拉甘送苏宁首败落后恒大6分争冠难了";
JiebaSegmenter segmenter = new JiebaSegmenter();
System.out.println(segmenter.sentenceProcess(text));
}
- 1
- 2
- 3
- 4
- 5
即可得到如下结果:
[前任, 拉甘送, 苏宁, 首败, 落后, 恒大, 6, 分, 争冠, 难, 了]