Carbon Forum
» lanlantian123
最后活动于2018-11-07
Carbon Forum是一个基于话题的高性能轻型PHP论坛
下载地址:Carbon Forum v5.9.0
QQ群:12607708(QQ我不常上)
手机支付宝扫描上方二维码可向本项目捐款
Carbon Forum Powered By © 2006-2018 Carbon
Forum V6.0.0 论坛统计
Processed in 1,763.522 ms,
3 SQL Query(s),
499.78 KiB Memory Usage
boss给了个做分词的任务,最开始想用的是结巴分词and正则表达式。后来发现结果并不好,需要一遍一遍筛选【第一个标准筛选出80%的数据,然后制定第二个标准,继续筛选,然后制定第三个标准筛选,等等等等】
自己用了一下结巴分词,感觉对于人名,地名,机构名,只是泛泛地使用了一下。在实际分开的时候,并不能很好地分开机构名称。于是转而使用hanlp分词
但是hanlp分词的缺点是只有在java上可以用,但是java一向又是我的弱项。所以在这里写一篇博客从头至尾叙述一下怎么样使用hanlp
而