一种基于图注意力网络与语法融合的医疗实体识别方法技术

技术编号:37491716 阅读:49 留言:0更新日期:2023-05-07 09:30
本发明专利技术公开了一种基于图注意力网络与语法融合的医疗实体识别方法,属于中文医疗命名实体识别技术领域,包括以下步骤:构建基于图嵌入的中文医疗命名实体识别模型,用于针对已识别医疗命名实体,分别构建依存关系图和交互式的字词关系图,将这些图分别经过不同的GAT网络进行嵌入操作,得到不同层次的字符表示,并进行融合后,经过CRF解码得到用于表征已识别医疗命名实体的序列标签;基于中文医疗命名实体识别模型,通过获取待识别医疗命名实体的序列标签,对待识别医疗命名实体进行识别;本发明专利技术针对中文医疗命名实体识别任务,在原本单一的字词关系中引入语法结构信息,增强了字符表征能力,提升了大粒度实体识别效果。提升了大粒度实体识别效果。提升了大粒度实体识别效果。

【技术实现步骤摘要】
一种基于图注意力网络与语法融合的医疗实体识别方法


[0001]本专利技术涉及中文医疗命名实体识别
,具体而言,涉及一种基于图注意力网络与语法融合的医疗实体识别方法。

技术介绍

[0002]近年来随着人工智能及大数据技术在医疗领域的普及,越来越多的医疗机构逐渐开始使用电子病历(ElectronicMedicalRe

cords,EMR)替代传统的纸质病历。这些医疗记录中包含了重要的医疗信息,例如临床症状、诊断结果、治疗方案等。电子病历数据是生物医学研究中最主要的经验数据来源,从电子病历中快速准确抽取医学信息可以更好地帮助科研人员进行学术研究,同时可以支持疾病预测和医学知识图谱构建任务。因此,近年来对电子病历数据的大量数据挖掘和分析得到了广泛的关注。然而,电子病历中的大多数信息都是以自然语言文本形式来存储的非结构化数据,在医学信息提取过程中,命名实体识别(NamedEntityRecognition,NER)是重要的提取手段之一。从狭义上来说,一般的命名实体识别任务的目的是从文本中识别出人名、地名、机构名等实体提及。它是机本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图注意力网络与语法融合的医疗实体识别方法,其特征在于,包括以下步骤:构建基于图嵌入的中文医疗命名实体识别模型,用于针对已识别医疗命名实体,分别构建依存关系图和交互式的字词关系图,将这些图分别经过不同的GAT网络进行嵌入操作,得到不同层次的字符表示,并进行融合后,经过CRF解码得到用于表征所述已识别医疗命名实体的序列标签;基于所述中文医疗命名实体识别模型,通过获取待识别医疗命名实体的所述序列标签,对所述待识别医疗命名实体进行识别。2.根据权利要求1所述一种基于图注意力网络与语法融合的医疗实体识别方法,其特征在于:在构建中文医疗命名实体识别模型的过程中,所述中文医疗命名实体识别模型由嵌入层、GAT层、融合层和CRF解码层组成。3.根据权利要求2所述一种基于图注意力网络与语法融合的医疗实体识别方法,其特征在于:在构建所述中文医疗命名实体识别模型的过程中,所述嵌入层用于采用字词联合的方式作为输入,获取字特征和词特征,通过挖掘字词间的关联,生成所述依存关系图和所述字词关系图;所述GAT层用于基于图卷积和注意力机制,对所述依存关系图和所述字词关系图,进行特征提取,分别获取所述依存关系图和所述字词关系图的词汇和句法知识;所述融合层用于融合所述依存关系图和所述多种字词关系图所捕获的不同词汇及句法知识;所述CRF解码层用于基于条件随机场策略,预测融合后的正确标签的概率,获取所述序列标签。4.根据权利要求3所述一种基于图注意力网络与语法融合的医疗实体识别方法,其特征在于:在通过嵌入层获取词向量的过程中,将giga字符向量和MedBERT预训练字向量,通过CNN网络,在对应维度拼接作为所述字符表示;通过获取所述已识别医疗命名实体的词语对应的词向量,作为所述词特征。5.根据权利要求4所述一种基于图注意力网络与语法融合的医疗实体识别方法,其特征在于:在通过嵌入层生成依存关系图的过程中,用于依存句法分析在序列标注任务中进行文本增强,构建了基于输入句子的依存关系图。6.根据权利要求5所述一种基于图注意力网络与语法融合的医疗实体识别方法,其特征在于:在通过嵌入层生成字词关系图的过程中,所述字词关系图由交互式的字词包含图、字词转移图、字词晶格图组成;其中,所述字词包含图,用于获取字符与其自匹配到词语之间的关联关系,以输入序列的每一个字符与其自匹配到的词作...

【专利技术属性】
技术研发人员:白宇何佳蔚
申请(专利权)人:沈阳航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1