一种医疗命名实体识别方法及系统技术方案

技术编号:29926189 阅读:9 留言:0更新日期:2021-09-04 18:46
本公开提供了一种医疗命名实体识别方法及系统,获取待识别的医疗文本数据;根据获取的医疗文本数据,得到至少一个句子中的词嵌入向量;进行句子中短语的语法角色标记,结合短语之间的依存关系,得到短语之间的关系图,根据预设图卷积神经网络中,得到特征向量;将获取的词嵌入向量和特征向量进行拼接,得到拼接后的输入向量;根据拼接后的输入向量和预设动态堆叠网络,得到医疗命名实体识别结果;本公开采用动态堆叠网络的原因是为了解决实体嵌套的问题,极大的提高了医疗命名实体的识别精度。度。度。

【技术实现步骤摘要】
一种医疗命名实体识别方法及系统


[0001]本公开涉及实体识别
,特别涉及一种医疗命名实体识别方法及系 统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
,并不必然构成现有 技术。
[0003]目前,出现了大量的电子病历数据,以电子格式提供的健康信息的可用性 是整个医疗领域提高质量和降低医疗保健成本的战略选择,近年来,医疗保健 系统在电子病历方面取得了重大突破。通过使用电子病历可以实现的实质性好 处包括质量、安全性和效率的提高,以及教育和研究的能力的增强。尽管如此, 在数据采用的过程中仍然存在许多障碍需要去克服。
[0004]医学数据的大规模研究,推动了医学领域的迅速发展。采用文本挖掘的方 式,提取存储在数据库中的大量可用医学报告信息,可以获得丰富的医学知识, 为医学研究和应用带来巨大的好处。在医学数据挖掘任务中,医疗命名实体的 识别和规范化是最基本的任务。
[0005]专利技术人发现,从这些数据中提取临床信息并不容易,因为这些数据是用自 然语言编写,充满医学术语、缩写词、速记符号、拼写错误和句子片段的记录。 除此之外,还面临着许多挑战和难点。比如:命名实体识别在识别的过程中会 存在实体彼此嵌套的问题。因此,语义注释资源尤为重要,比如句法结构分析 在命名实体识别任务上也起着重要的作用。但是由于中文表达和英语表达不同, 中文存在分词的问题,使得目前现阶段的句法分析大多数都集中在英语上。

技术实现思路

[0006]为了解决现有技术的不足,本公开提供了一种医疗命名实体识别方法及系 统,采用动态堆叠网络的原因是为了解决实体嵌套的问题;采用XLnet预训练 模型生成嵌入向量,更好地提取了医疗文本数据中的语义特征;采用图卷积神 经网络对句法分析结果中结点的局部依赖关系建模,提取了有用的语法信息生 成的嵌入向量,为命名实体识别任务提供了更丰富的语义特征,极大的提高了 医疗命名实体的识别精度。
[0007]为了实现上述目的,本公开采用如下技术方案:
[0008]本公开第一方面提供了一种医疗命名实体识别方法。
[0009]一种医疗命名实体识别方法,包括以下过程:
[0010]获取待识别的医疗文本数据;
[0011]根据获取的医疗文本数据,得到至少一个句子中的词嵌入向量;
[0012]进行句子中短语的语法角色标记,结合短语之间的依存关系,得到短语之 间的关系图,根据预设图卷积神经网络中,得到特征向量;
[0013]将获取的词嵌入向量和特征向量进行拼接,得到拼接后的输入向量;
[0014]根据拼接后的输入向量和预设动态堆叠网络,得到医疗命名实体识别结果。
[0015]进一步的,动态堆叠网络中,根据句子的嵌套层数确定Transformer

CRF层 的叠加数量。
[0016]更进一步的,如果当前Transformer

CRF层预测到实体,则引入一个新的 Transformer

CRF层,结合当前Transformer

CRF层检测到的每个实体的单词序 列表示,组成该实体的新表示,然后将其作为输入传递到新的Transformer

CRF 层。
[0017]更进一步的,动态堆叠网络中,如果当前Transformer

CRF层检预测到非实 体,则保留字符表示而不进行任何处理。
[0018]进一步的,将短语定义为结点,将短语之间的依存关系定义为边,利用图 卷积神经网络通过图上操作聚集结点的邻域特征;
[0019]如果只有一层卷积,则捕获直接邻居节点特征,如果具有多层卷积堆叠卷 积层,则捕获最多K跳跃的任何结点特征。
[0020]进一步的,短语之间的依存关系分析时没有非终结符,词与词相互依存, 两个词分别为核心词和从属词,用有向弧表示,弧的方向为核心词指向从属词, 弧上的标记为依存关系类型。
[0021]进一步的,利用XLnet语言模型进行词向量的获取,且XLnet语言模型采 用双流注意力机制。
[0022]本公开第二方面提供了一种医疗命名实体识别系统。
[0023]一种医疗命名实体识别系统,包括:
[0024]数据获取模块,被配置为:获取待识别的医疗文本数据;
[0025]词嵌入向量获取模块,被配置为:根据获取的医疗文本数据,得到至少一 个句子中的词嵌入向量;
[0026]特征向量提取模块,被配置为:进行句子中短语的语法角色标记,结合短 语之间的依存关系,得到短语之间的关系图,根据预设图卷积神经网络中,得 到特征向量;
[0027]向量拼接模块,被配置为:将获取的词嵌入向量和特征向量进行拼接,得 到拼接后的输入向量;
[0028]实体识别模块,被配置为:根据拼接后的输入向量和预设动态堆叠网络, 得到医疗命名实体识别结果。
[0029]本公开第三方面提供了一种计算机可读存储介质,其上存储有程序,该程 序被处理器执行时实现如本公开第一方面所述的医疗命名实体识别方法中的步 骤。
[0030]本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储 器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第 一方面所述的医疗命名实体识别方法中的步骤。
[0031]与现有技术相比,本公开的有益效果是:
[0032]1、本公开所述的方法、系统、介质或电子设备,采用动态堆叠网络的原因 是为了解决实体嵌套的问题,极大的提高了医疗命名实体的识别精度。
[0033]2、本公开所述的方法、系统、介质或电子设备,采用XLnet预训练模型生 成嵌入向量,更好地提取了医疗文本数据中的语义特征,进一步的提高了医疗 命名实体的识别精度。
[0034]3、本公开所述的方法、系统、介质或电子设备,采用图卷积神经网络对句 法分析
结果中结点的局部依赖关系建模,提取了有用的语法信息生成的嵌入向 量,为命名实体识别任务提供了更丰富的语义特征,更进一步的提高了医疗命 名实体的识别精度。
[0035]本公开附加方面的优点将在下面的描述中部分给出,部分将从下面的描述 中变得明显,或通过本公开的实践了解到。
附图说明
[0036]构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公 开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
[0037]图1为本公开实施例1提供的基于动态堆叠网络的命名实体识别方法的算 法结构示意图。
[0038]图2为本公开实施例1提供的XLnet模型结构图。
[0039]图3为本公开实施例1提供的XLnet模型的mask机制示例图。
[0040]图4为本公开实施例1提供的依存句法分析结构图。
[0041]图5为本公开实施例1提供的基于图卷积神经网络的特征提取架构图。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗命名实体识别方法,其特征在于:包括以下过程:获取待识别的医疗文本数据;根据获取的医疗文本数据,得到至少一个句子中的词嵌入向量;进行句子中短语的语法角色标记,结合短语之间的依存关系,得到短语之间的关系图,根据预设图卷积神经网络中,得到特征向量;将获取的词嵌入向量和特征向量进行拼接,得到拼接后的输入向量;根据拼接后的输入向量和预设动态堆叠网络,得到医疗命名实体识别结果。2.如权利要求1所述的医疗命名实体识别方法,其特征在于:动态堆叠网络中,根据句子的嵌套层数确定Transformer

CRF层的叠加数量。3.如权利要求2所述的医疗命名实体识别方法,其特征在于:如果当前Transformer

CRF层预测到实体,则引入一个新的Transformer

CRF层,结合当前Transformer

CRF层检测到的每个实体的单词序列表示,组成该实体的新表示,然后将其作为输入传递到新的Transformer

CRF层。4.如权利要求2所述的医疗命名实体识别方法,其特征在于:动态堆叠网络中,如果当前Transformer

CRF层检预测到非实体,则保留字符表示而不进行任何处理。5.如权利要求1所述的医疗命名实体识别方法,其特征在于:将短语定义为结点,将短语之间的依存关系定义为边,利用图卷积神经网络通过图上操作聚集结点的邻域特征;如果只有一层卷积,...

【专利技术属性】
技术研发人员:王红韩书李威庄鲁贺张慧余盛朋王正军杨杰杨雪滑美芳于晓梅
申请(专利权)人:山东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1