好文档 - 专业文书写作范文服务资料分享网站

多场景文本的细粒度命名实体识别

天下 分享 时间: 加入收藏 我要投稿 点赞

多场景文本的细粒度命名实体识别

盛 剑1,向政鹏1,秦 兵1,刘 铭1,王莉峰2

【摘 要】命名实体识别一直是数据挖掘领域的经典问题之一,尤其随着网络数据的剧增,如果能对多来源的文本数据进行多领域、细粒度的命名实体识别,显然能够为很多的数据挖掘应用提供支持。该文提出一种多领域、细粒度的命名实体识别方法,利用网络词典回标文本数据获得了大量的粗糙训练文本。为防止训练文本中的噪声干扰命名实体识别的结果,该算法将命名实体识别的过程划分为两个阶段,第一个阶段先获得命名实体的领域标签,之后利用命名实体的上下文确定命名实体的细粒度标签。实验结果显示,该文提出的方法使F1值在全领域上平均值达到了80%左右。 【期刊名称】中文信息学报 【年(卷),期】2019(033)006 【总页数】8

【关键词】命名实体识别;细粒度类别划分;语料回标 定稿日期: 2019-02-28

基金项目:国家自然科学基金(61632011,61772156,61472107)

0 引言

命名实体识别(named entity recognition, NER)是自然语言处理领域(natural language processing, NLP)的基础任务之一,也是信息抽取中最为重要的一个子任务,并且可以对后续的抽取任务提供帮助。命名实体识别任务意在识别文本中的事物的名称,例如人名、地名和机构名。本文主要在多场景多领域下研究命名实体识别,以LSTM-CRF为基础并引入CNN(卷积神经网络)从文本

多场景文本的细粒度命名实体识别

多场景文本的细粒度命名实体识别盛剑1,向政鹏1,秦兵1,刘铭1,王莉峰2【摘要】命名实体识别一直是数据挖掘领域的经典问题之一,尤其随着网络数据的剧增,如果能对多来源的文本数据进行多领域、细粒度的命名实体识别,显然能够为很多的数据挖掘应用提供支持。该文提出一种多领域、细粒度的命名实体识别方法,利用网络词典回标文本数据获得了大
推荐度:
点击下载文档文档为doc格式
2xc53688ub0h1ll01eyq0a6ri16osu014gh
领取福利

微信扫码领取福利

微信扫码分享