当前位置: 首页 > 专利查询>浙江大学专利>正文

基于多语义特征融合的人工智能领域实体识别方法及系统技术方案

技术编号:40593414 阅读:16 留言:0更新日期:2024-03-12 21:55
本发明专利技术公开了一种基于多语义特征融合的人工智能领域实体识别方法及系统,属于文本实体识别领域。本发明专利技术将编码器、双向长短期记忆网络层、注意力融合层和条件随机场层级联形成实体识别模型,通过对编码器中的BERT模型和注意力融合层中的注意力机制进行改进,再结合对条件随机场层中损失函数的优化,显著提高了在人工智能领域中实体识别和关系抽取的准确度,能够提升模型的稳定性和泛化能力。本发明专利技术可解决人工智能领域实体识别过程中存在的文本过长、内容复杂、实体与实体之间存在强关联关系等问题,准确实现人工智能领域长文本段落中的实体识别。

【技术实现步骤摘要】

本专利技术属于实体识别领域,尤其涉及一种适用于人工智能领域长文本段落的实体识别方法及系统。


技术介绍

1、实体识别在不同应用场景中呈现出各异的需求和挑战。在人工智能(ai)领域中,ai知识文本存在内容长度往往比普通的文本段落要长,并且内容相当复杂,实体与实体之间存在强关联的关系问题。人工智能领域的知识体系具有高度的关联性,例如在“卷积神经网络被广泛应用于图像识别任务,因为它们在处理图像数据方面特别有效”这句话中,可以抽取出“用于”或“应用于”等关系,显示出实体之间的强关联性。这种特性为实体关系抽取带来了额外的复杂性。

2、鉴于现有技术中存在的上述挑战,传统的实体识别框架难以胜任人工智能领域存在复杂关联关系的长文本段落实体识别任务,因此如何改进实体识别框架,提高其对长文本段落、稀疏数据和复杂实体关系的处理能力,是目前亟待解决的技术问题。


技术实现思路

1、本专利技术的目的在于解决现有技术中传统实体识别框架难以准确完成人工智能领域存在复杂关联关系的长文本段落实体识别任务,并提供一种基于多语义特征融合的本文档来自技高网...

【技术保护点】

1.一种基于多语义特征融合的人工智能领域实体识别方法,其特征在于,包括:

2.如权利要求1所述的基于多语义特征融合的人工智能领域实体识别方法,其特征在于,所述BERT模型中共设有12层Transformer编码层,且每个第一词向量依次经过12层Transformer编码层获得不同层级的编码向量,12层编码向量拼接后作为第一词向量对应的所述拼接向量。

3.如权利要求1所述的基于多语义特征融合的人工智能领域实体识别方法,其特征在于,所述第一全连接层通过tanh激活函数进行激活输出。

4.如权利要求1所述的基于多语义特征融合的人工智能领域实体识别方法,其特征...

【技术特征摘要】

1.一种基于多语义特征融合的人工智能领域实体识别方法,其特征在于,包括:

2.如权利要求1所述的基于多语义特征融合的人工智能领域实体识别方法,其特征在于,所述bert模型中共设有12层transformer编码层,且每个第一词向量依次经过12层transformer编码层获得不同层级的编码向量,12层编码向量拼接后作为第一词向量对应的所述拼接向量。

3.如权利要求1所述的基于多语义特征融合的人工智能领域实体识别方法,其特征在于,所述第一全连接层通过tanh激活函数进行激活输出。

4.如权利要求1所述的基于多语义特征融合的人工智能领域实体识别方法,其特征在于,所述注意力融合层中,第三词向量序列中每个当前第三词向量的上下文向量计算方法为:首先以前馈神经网络作为评分函数,计算第三词向量序列中每个第三词向量相对于当前第三词向量的语义关联度评分;然后将计算得到的所有语义关联度评分进行softmax归一化,将语义关联度评分转换为权重值;最后将第三词向量序列中的所有第三词向量利用各自对应的权重值进行加权融合,形成当前第三词向量对应的上下文向量。

5.如权利要求1所述的...

【专利技术属性】
技术研发人员:肖俊宋哲夫
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1