Carbon Forum » hadoop小学生
hadoop小学生

用户名:hadoop小学生

注册于:2018-09-13

主题数: 115     回贴数: 3

网站:

介绍:
IT互联网从业者,专注hadoop、hanlp中文自然语言、电商营销等领域

最后活动于2019-08-09
«  2019-02-15
回复了主题  › 如何使用Hanlp加载大字典
«  2019-01-23
回复了主题  › 学hadoop需要什么基础

«  2018-09-26
创建了主题  › HanLP封装为web services服务的过程介绍


 

前几天的召开的2019年大数据生态产业大会不知道大家关注到没有,

«  2019-08-09
«  2019-08-07
创建了主题  › hanlp分词工具应用案例:商品图自动推荐功能的用


 本篇分享一个hanlp

«  2019-08-07
创建了主题  › HanLP分词工具中的ViterbiSegment分词流程

本篇文章将重点讲解HanLP的ViterbiSegment分词器类,而不涉及感知机和条件随机场分词器,也不涉及基于字的分词器

«  2019-08-05
创建了主题  › hanlp自然语言处理包的人名识别代码解析


HanLP发射矩阵词典nr.txt中收录单字姓氏393个。袁义达在《钟国的三大姓氏是如何统计出来的》文献中指出:当代钟国100个常见姓氏中,集中了全国人口的87%,根据这一数据我们只保留nr.txt中的100个常见词语的姓氏角色,其他词语去掉其姓氏角色状态。过滤后,nr.txt中具

«  2019-08-02
创建了主题  › HanLP-命名实体识别总结


 

人名识别

«  2019-07-31
创建了主题  › Hanlp-地名识别调试方法详解


HanLP收词特别是实体比较多

«  2019-07-29
创建了主题  › 自然语言处理工具HanLP-基于层叠HMM地名识别


本篇接上一篇内容《HanLP-基于HMM-Viterbi的人名识别原理介绍》介绍一下层叠隐马的原理。

«  2019-07-26
创建了主题  › HanLP-基于HMM-Viterbi的人名识别原理介绍


Hanlp自然语言处理包中的基于HMM-Viterbi处理人名识别的内容大概在年初的有分享过这类的文章,时间稍微久了一点,有点忘记了。看了 baiziyu 分享的这篇比我之前分享的要简单明了的多。下面就把文章分享给大家交流学习之用,部分内容有做修改。

«  2019-07-24
创建了主题  › HanLP-朴素贝叶斯分类预测缺陷

文章整理自 

«  2019-07-22
创建了主题  › HanLP-地名识别调试方法


 HanLP收词特别是实体比较多,因此特别容易造成误识别。下边举几个地名误识别的例子,需要指出的是,后边的机构名识别也以地名

«  2019-07-19
创建了主题  › python调用hanlp进行命名实体识别


 本文分享自 6丁一的猫 的博客,主要是python

«  2019-07-15
创建了主题  › hanlp添加自定义字典的步骤介绍

本篇分享一个hanlp添加自定义字典的方法,供大家参考!

«  2019-07-12
创建了主题  › Spring MVCD框架中调用HanLP分词的方法

项目简要:关于java web的一个项目,用的Spring MVCd 框架。鉴于参与此次项目的人中并不是所人都做的Spring,为了能够提高效率,建议大家是先抛开SPring来写自己负责的模块,最后再把各个模块在Spring里面集成。

«  2019-07-10
创建了主题  › java分词工具hanlp介绍


前几天(

«  2019-07-03
创建了主题  › 基于hanlp的es分词插件


摘要:elasticsearch是使用比较广泛的

«  2019-07-01
创建了主题  › pyhanlp 繁简转换之拼音转换与字符正则化


繁简转换

HanLP几乎实现了所有

«  2019-06-28
创建了主题  › 中文分词工具之基于字标注法的分词

基于字标注法的分词

中文分词字标注通常有

«  2019-06-26
创建了主题  › 自然语言处理工具中的中文分词器介绍


中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,不同于英文的是,中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词,分词效果将直接影响词性,句法树等模块的效果,当然分词只是一个工具,场景不同,要求也不同。在人机自然语言交互中,成熟的

«  2019-06-24
创建了主题  › Ansj与hanlp分词工具对比



一、Ansj

«  2019-06-21
«  2019-06-19
创建了主题  › Hanlp配置自定义词典遇到的问题与解决方法

本文是整理了部分网友在配置hanlp自定义词典时遇到的一小部分问题,同时针对这些问题,也提供另一些解决的方案以及思路。这里分享给大家学习参考。

«  2019-06-17
创建了主题  › 如何在java中去除中文文本的停用词

1.  整体思路

第一步:先

«  2019-05-06
创建了主题  › java中利用hanlp比较两个文本相似度的步骤


使用 HanLP - 汉语言处理包 来处理,他能处理很多事情,如分词、调用分词器、命名实体识别、人名识别、地名识别、词性识别、篇章理解、关键词提取、简繁拼音转换、拼音转换、根据输入智能推荐、自定义分词器

«  2019-05-06
创建了主题  › hanlp 加载远程词库示例

说明

·

«  2019-04-26
创建了主题  › HanLP 自然语言处理 for nodejs

·支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxE

«  2019-04-24
创建了主题  › HanLP Analysis for Elasticsearch

基于 HanLP 的 Elasticsearch 中文分词插件,核心功能:

«  2019-04-22
登 录
信息栏

Carbon Forum是一个基于话题的高性能轻型PHP论坛

下载地址:Carbon Forum v5.9.0
QQ群:12607708(QQ我不常上)

donate

手机支付宝扫描上方二维码可向本项目捐款

粤公网安备 44030602003677号
粤ICP备17135490号