一种标签增强的命名实体识别方法技术

技术编号：37987374 阅读：8 留言：0更新日期：2023-06-30 10:02

本发明专利技术提供一种标签增强的命名实体识别方法，涉及标签识别技术领域。包括采用深度强化学习的方式引入语义和标签差异进行建模，该方法包括以下步骤：S1、对于每一个实体类型，通过搜索引擎检索的方式获得候选的标签描述文本，由人工对候选的标签描述文本进行归纳总结，得到最终的标签描述文本，S2、按照实体标签种类，对句子中的实体进行分组，标签类型相同的分为一组，并记录每个实体在句子中的开始位置和结束位置。本发明专利技术在文本中融合标签的语义信息，以及对标签类型直接的关系进行建模，使得标签的命名实体识别效果大大增加，增加了后续的设备识别准确率，进而可以实现广泛推广使用。用。用。

全部详细技术资料下载

【技术实现步骤摘要】
一种标签增强的命名实体识别方法

[0001]本专利技术涉及标签识别
，特别涉及一种标签增强的命名实体识别方法。

技术介绍

[0002]近年来，深度学习和机器学习在计算机视觉和自然语言处理方面取得很大进展，在计算机视觉方面，人们利用深度神经网络对图像进行分类，比如利用卷积神经网络对手写数字进行识别，并且在这方面取得了超过人类自身识别的准确率；在自然语言处理方面，深度学习更是被应用在了各个生活场景，比如利用神经网络分析用户的浏览记录和消费行为，推送用户可能喜欢的产品，以及利用大量的平行语料库训练翻译系统，使机器达到高水平的翻译能力。随着互联网用户的增多，其产生的信息也越来越多，如何在自动化地在这些大量用户信息中提取有用信息，具有十分重要的意义，中文命名实体识别作为信息提取的上游任务，其发展对于信息提取技术十分关键。
[0003]传统的命名实体识别对文本中的每一个字符进行分类，没有利用上标签的语义信息，此外此方法也未考虑到标签类型之间的依赖关系，导致大多忽略了标签与词之间的语义信息以及标签类型之间的依赖信息。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术的不足，本专利技术提供了一种标签增强的命名实体识别方法，解决了传统的识别方法忽略了标签与词之间的语义信息以及标签类型之间的依赖信息，本专利技术提出了一个标签感知的命名实体识别方法，在文本中融合标签的语义信息，以及对标签类型直接的关系进行建模的问题。
[0006](二)技术方案
[0007]为实...

【技术保护点】

【技术特征摘要】
1.一种标签增强的命名实体识别方法，其特征在于：包括采用深度强化学习的方式引入语义和标签差异进行建模，该方法包括以下步骤：S1、对于每一个实体类型，通过搜索引擎检索的方式获得候选的标签描述文本，由人工对候选的标签描述文本进行归纳总结，得到最终的标签描述文本；S2、按照实体标签种类，对句子中的实体进行分组，标签类型相同的分为一组，并记录每个实体在句子中的开始位置和结束位置；S3、对于句子Sent，假设标签类型为A、B，A标签的描述文本为A_Text，B标签的描述文本为B_Text将句子的标签和句子文本拼接作为输入；S4、将整个序列经过BERT编码，得到句子和标签语言之间交互以及标签与标签交互的隐藏层表示H；S5、将所有标签类型取出来经过self
‑
attention得到新的标签类型表示；S6、对于每一种标签类型，采用一个条件融合函数CLN将标签类型信息整合到句子中每一个字符的隐藏层表示；S7、对于每一种实体类型，使用CRF建模序列之间的关系。2.根据权利要求1所述的...

【专利技术属性】
技术研发人员：李杨静，
申请(专利权)人：杭州合慕科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人