行业百科>自然语言处理中的 NER
自然语言处理中的 NER
2023-12-19 16:12:51
NER(Named Entity Recognition,命名实体识别)是自然语言处理中的一项基础关键性任务,指识别文本中具有特定意义的实体,主要包括人名、地名、专有名词、机构名等。命名实体识别是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具。
命名实体识别的过程通常包括两部分:实体边界识别和实体类别判断。命名实体识别的方法从模型的层面来看,可以分为:基于规则的方法、无监督学习方法和有监督学习方法。
基于规则的方法:依靠人工制定的规则,规则的设计一般基于句法、语法、词汇的模式,包括特定领域的知识。当词典的大小有限时,基于规则的方法可以达到较好的效果。这种方法具有高精确率和低召回率的特点。
无监督学习方法:利用语义相似性进行聚类,从聚类得到的组当中抽取命名实体,通过统计数据推断实体类别。
有监督学习方法:可以表示为多分类任务或者序列标注任务,从数据中学习。
希望以上信息对你有帮助,建议咨询实在智能RPA,获取更多专业内容。
上一篇文章
多种格式文档快速智能比对
下一篇文章
合同关键信息自动化提取
相关新闻
流程挖掘和RPA的关系
2023-12-19 16:59:02
智能文档自定义设置比对规则
2023-12-19 17:07:54
如何保证RPA在数据同步时的一致性
2023-12-19 15:49:38
免费领取更多行业解决方案
立即咨询