一种基于多特征融合学习的领域知识图谱实体识别方法技术

技术编号:45510455 阅读:22 留言:0更新日期:2025-06-13 17:16
本发明专利技术属于领域知识图谱实体识别技术领域,具体公开了基于多特征融合学习的领域知识图谱实体识别方法,包括:将句子序列输入至BERT模型转化为高维向量提取全局语义特征,得到词向量;将词向量输入至BiLSTM+Fused attention网络进行双向序列建模,得到增强后的特征,并对增强后的特征进行多特征融合,得到标签序列;将标签序列输入至CRF层进行全局优化,得到符合命名实体的语法规则和上下文逻辑的输出序列,完成领域知识图谱实体识别。本发明专利技术解决了领域知识图谱中命名实体识别由于数据的稀缺性或难以获取,导致生成的知识图谱在专业领域的覆盖度和准确性上存在限制的问题,提高了命名实体识别的精确度和召回率。

【技术实现步骤摘要】

本专利技术属于领域知识图谱实体识别,具体涉及一种基于多特征融合学习的领域知识图谱实体识别方法


技术介绍

1、领域知识图谱作为一种结构化的知识表示方法,在诸多特定领域展现出了其独特的价值,例如在人工智能、医疗、法律、教育等专业领域,对知识的精确性和深度要求极高。在专业领域中,命名实体识别作为构建知识图谱的关键技术和环节,由于数据的稀缺性或难以获取,导致生成的知识图谱在专业领域的覆盖度和准确性上存在限制。以下是几种常用的技术方案:

2、1.基于多语义的级联transformer中文医疗实体识别方法,通过匹配句子和外部医疗词典,构建包含汉字和匹配词汇的lattice序列。采用句法解析器来解析输入的句子,得到句子的句法树,并设计句法关系转换规则将基于词的句法树结果转换为基于字的句法关系矩阵。将lattice序列传入lattice transformer模块,利用词汇感知的自注意力机制来建模lattice特征。将得到的lattice特征和句法关系矩阵传入syntax transformer模块来进一步提取句法特征。通过这种级联的建模方式,得到了融合字词本文档来自技高网...

【技术保护点】

1.一种基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,所述步骤S1具体包括以下分步骤:

3.根据权利要求2所述的基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,步骤S11中所述句子集合S为:

4.根据权利要求1所述的基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,步骤S2中所述BiLSTM+Fused attention网络包括BiLSTM模块和Fused attention模块;

5.根据权利要求4所述的基于多...

【技术特征摘要】

1.一种基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,所述步骤s1具体包括以下分步骤:

3.根据权利要求2所述的基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,步骤s11中所述句子集合s为:

4.根据权利要求1所述的基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,步骤s2中所述bilstm+fused attention网络包括bilstm模块和fused attention模块;

5.根据权利要求4所述的基于多特征融合学习的领域知识图谱实体识别方法,其特征在于,所述增强后的特征bl表述公式为:

6.根据权利要求4所述的基于多特征融合学习的领域知...

【专利技术属性】
技术研发人员:李婵李瑞黑蕾邢钧峰徐悦甡马寅汝王琳方杜璇张涵
申请(专利权)人:青海师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1