System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 实体关系抽取的病历分析方法、装置、计算机设备及介质制造方法及图纸_技高网

实体关系抽取的病历分析方法、装置、计算机设备及介质制造方法及图纸

技术编号:40273314 阅读:12 留言:0更新日期:2024-02-02 22:59
本发明专利技术适用于医疗技术领域,尤其涉及一种实体关系抽取的病历分析方法、装置、计算机设备及介质。本发明专利技术通过编码对应字符的字符向量并排列得到对应句子的字符向量序列,将字符与开始实体之间的第一距离和与结束实体之间的第二距离的比值确定为对应字符的位置特征值,并拼接得到对应句子的位置特征序列,根据字符向量序列和位置特征序列得到融合向量并提取融合特征,使用注意力模型计算注意力权重并对融合特征进行加权求和,得到病历的文本特征,使用分类器对文本特征进行分类,得到分类结果来对病历进行归档,结合字符向量信息、字符位置信息和注意力权重提高了实体关系抽取结果和病历归档的准确性,促进了医疗领域中科研、教学、管理工作的发展。

【技术实现步骤摘要】

本专利技术适用于医疗,尤其涉及一种实体关系抽取的病历分析方法、装置、计算机设备及介质


技术介绍

1、随着数字医疗技术的发展,智能医疗系统、智慧医疗系统、云医疗系统等应运而生,在此类医疗系统中,病患信息和疾病资料均为数字化的信息,并存储在数据库中,便于随时随地查阅相关资料以进行病历分析。为了提高病历资料的规范性,便于更快速地找到需要的病历,可以通过抽取病患信息中的疾病关系来对病历进行归档。

2、病历归档基于关系抽取技术实现,关系抽取是信息抽取的基本任务之一,目的是识别文本中实体的目标关系,对于知识库的构建以及文本的理解十分重要,在金融、医疗、教育等多个领域的文本理解任务中均具有广泛的应用。例如,在医疗
中,关系抽取技术可以抽取病历文本中的疾病与病症、疾病与基因、疾病与药物、疾病与并发症等关系,作为对病历进行归档的基础。

3、由于病历分析方法中的模型依赖于大量数据集的训练,在一些训练语料匮乏的情况下,模型通常无法得到充分的训练,很难获得好的关系抽取效果。为了解决上述问题,现有技术中通过远程监督为训练语料匮乏的领域中的关系抽取任务提供大量自动标注的数据集,且远程监督技术的领域迁移性强,有效解决了训练语料匮乏的问题。但是,远程监督的方法构造的数据集伴随着强约束性的假设,在构建语料过程中引入了错误标签,这些噪声数据极大影响了最终模型的性能,导致病历分析结果的准确性较低。

4、因此,在医疗
中,如何提高病历分析结果的准确性成为亟待解决的问题。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种实体关系抽取的病历分析方法、装置、计算机设备及介质,以解决在训练语料匮乏的场景中,现有病历分析结果的准确性较低的问题。

2、第一方面,本专利技术实施例提供一种实体关系抽取的病历分析方法,所述病历分析方法包括:

3、获取用户输入的病历,提取所述病历中的n个句子,以及每个句子中的字符和对应的字符位置,对每个字符进行向量编码,得到对应的字符向量,n为正整数;

4、针对任一句子,根据所述句子中的所有字符及其字符位置,对所有字符对应的字符向量进行排列,得到对应所述句子的字符向量序列,从所述句子中确定表征起始含义的开始实体和表征结束含义的结束实体;

5、针对所述句子中的任一字符,计算所述字符与所述开始实体之间的第一距离以及与所述结束实体之间的第二距离,将所述第一距离和所述第二距离的比值,确定为对应所述字符的位置特征值,根据所有字符的字符位置,对所有字符对应的位置特征值进行拼接,得到对应所述句子的位置特征序列;

6、对所述句子的字符向量序列和位置特征序列进行融合,得到融合向量,对所述融合向量进行特征提取,得到对应所述句子的融合特征;

7、使用训练好的注意力模型对每个句子对应的融合特征进行注意力计算,得到对应句子的注意力权重,使用每个句子对应的注意力权重对所有句子的融合特征进行加权求和,得到所述病历的文本特征;

8、使用训练好的分类器对所述文本特征进行分类,得到分类结果,根据所述分类结果对所述病历进行归档。

9、第二方面,本专利技术实施例提供一种实体关系抽取的病历分析装置,所述病历分析装置包括:

10、字符编码模块,用于获取用户输入的病历,提取所述病历中的n个句子,以及每个句子中的字符和对应的字符位置,对每个字符进行向量编码,得到对应的字符向量,n为正整数;

11、字符向量排列模块,用于针对任一句子,根据所述句子中的所有字符及其字符位置,对所有字符对应的字符向量进行排列,得到对应所述句子的字符向量序列,从所述句子中确定表征起始含义的开始实体和表征结束含义的结束实体;

12、位置特征值拼接模块,用于针对所述句子中的任一字符,计算所述字符与所述开始实体之间的第一距离以及与所述结束实体之间的第二距离,将所述第一距离和所述第二距离的比值,确定为对应所述字符的位置特征值,根据所有字符的字符位置,对所有字符对应的位置特征值进行拼接,得到对应所述句子的位置特征序列;

13、融合特征提取模块,用于对所述句子的字符向量序列和位置特征序列进行融合,得到融合向量,对所述融合向量进行特征提取,得到对应所述句子的融合特征;

14、注意力加权模块,用于使用训练好的注意力模型对每个句子对应的融合特征进行注意力计算,得到对应句子的注意力权重,使用每个句子对应的注意力权重对所有句子的融合特征进行加权求和,得到所述病历的文本特征;

15、病历分类归档模块,用于使用训练好的分类器对所述文本特征进行分类,得到分类结果,根据所述分类结果对所述病历进行归档。

16、第三方面,本专利技术实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的病历分析方法。

17、第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的病历分析方法。

18、本专利技术实施例与现有技术相比存在的有益效果是:通过获取用户输入的病历,提取病历中的n个句子,以及每个句子中的字符和对应的字符位置,对每个字符进行向量编码,得到对应的字符向量,针对任一句子,根据句子中的所有字符及其字符位置,对所有字符对应的字符向量进行排列,得到对应句子的字符向量序列,从句子中确定表征起始含义的开始实体和表征结束含义的结束实体,针对句子中的任一字符,计算字符与开始实体之间的第一距离以及与结束实体之间的第二距离,将第一距离和第二距离的比值,确定为对应字符的位置特征值,根据所有字符的字符位置,对所有字符对应的位置特征值进行拼接,得到对应句子的位置特征序列,对句子的字符向量序列和位置特征序列进行融合,得到融合向量,对融合向量进行特征提取,得到对应句子的融合特征,使用训练好的注意力模型对每个句子对应的融合特征进行注意力计算,得到对应句子的注意力权重,使用每个句子对应的注意力权重对所有句子的融合特征进行加权求和,得到病历的文本特征,使用训练好的分类器对文本特征进行分类,得到分类结果,根据分类结果对病历进行归档,结合句子的字符向量信息和字符位置信息,提高了对句子信息的表征能力,并通过对句子的融合特征进行注意力加权,通过充分考虑不同句子在对病历进行实体关系抽取时的重要性,减轻了噪声句子对实体关系抽取结果的影响,提高了实体关系抽取结果的准确性,在医疗
中提高了对病历进行实体关系抽取和归档的准确性,有效地促进了医疗领域中科研、教学、管理等工作的发展。

本文档来自技高网...

【技术保护点】

1.一种实体关系抽取的病历分析方法,其特征在于,所述病历分析方法包括:

2.根据权利要求1所述的病历分析方法,其特征在于,所述从所述句子中确定表征起始含义的开始实体和表征结束含义的结束实体包括:

3.根据权利要求1所述的病历分析方法,其特征在于,所述计算所述字符与所述开始实体之间的第一距离以及与所述结束实体之间的第二距离包括:

4.根据权利要求1所述的病历分析方法,其特征在于,所述对所述融合向量进行特征提取,得到对应所述句子的融合特征包括:

5.根据权利要求1所述的病历分析方法,其特征在于,所述训练好的注意力模型包括第一注意力模型和第二注意力模型;

6.根据权利要求1所述的病历分析方法,其特征在于,所述提取所述病历中的N个句子,以及每个句子中的字符和对应的字符位置,对每个字符进行向量编码,得到对应的字符向量包括:

7.一种实体关系抽取的病历分析装置,其特征在于,所述病历分析装置包括:

8.根据权利要求7所述的病历分析装置,其特征在于,所述字符向量排列模块包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的病历分析方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的病历分析方法。

...

【技术特征摘要】

1.一种实体关系抽取的病历分析方法,其特征在于,所述病历分析方法包括:

2.根据权利要求1所述的病历分析方法,其特征在于,所述从所述句子中确定表征起始含义的开始实体和表征结束含义的结束实体包括:

3.根据权利要求1所述的病历分析方法,其特征在于,所述计算所述字符与所述开始实体之间的第一距离以及与所述结束实体之间的第二距离包括:

4.根据权利要求1所述的病历分析方法,其特征在于,所述对所述融合向量进行特征提取,得到对应所述句子的融合特征包括:

5.根据权利要求1所述的病历分析方法,其特征在于,所述训练好的注意力模型包括第一注意力模型和第二注意力模型;

6.根据权利要求1所述的病历分析方法,其特征在于,所述...

【专利技术属性】
技术研发人员:于凤英王健宗程宁
申请(专利权)人:平安创科科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1