一种医学文本的分析方法技术

技术编号:39843421 阅读:8 留言:0更新日期:2023-12-29 16:34
本说明书公开了一种医学文本的分析方法

【技术实现步骤摘要】
一种医学文本的分析方法、装置、存储介质及电子设备


[0001]本说明书涉及医疗领域,尤其涉及一种医学文本的分析方法

装置

存储介质及电子设备


技术介绍

[0002]随着自然语言处理技术的发展,自然语言处理的模型应用于各个领域

例如,医学领域,针对某一病症,不同用户对该病症的描述可能存在较大差异

也就是说,通过不同用户描述同一病症得到的医学文本存在较大差异

那么,将医学文本将输入文本分析模型输出的分析结果也会存在较大差异

因此,如何规范化医学文本是亟待解决的问题

此外,对医学文本进行分析时,如何提高医学文本分析的准确性及效率是亟待解决的问题

[0003]基于此,本说明书提供一种医学文本的分析方法


技术实现思路

[0004]本说明书提供一种医学文本的分析方法

装置

存储介质及电子设备,以至少部分的解决现有技术存在的上述问题

[0005]本说明书采用下述技术方案:
[0006]本说明书提供一种医学文本的分析方法,包括:
[0007]获取用户的原始医学文本;
[0008]将所述原始医学文本输入预先训练的文本规范化模型,得到所述文本规范化模型输出的标准医学文本;
[0009]将所述标准医学文本输入预先训练的文本分析模型,获得所述文本分析模型输出的针对所述标准医学文本的分析结果

[0010]可选地,所述原始医学文本包括影像所见

病例文本

[0011]可选地,所述文本规范化模型包括大规模语言模型;所述文本分析模型包括大规模语言模型

[0012]可选地,训练所述文本规范化模型,具体包括:
[0013]获取非标准化医学文本;
[0014]根据标准化医学语料库,确定所述非标准化医学文本的标准医学文本,作为所述非标准化医学文本的标签;
[0015]将所述非标准化医学文本输入文本规范化模型,确定所述文本规范化模型输出的样本标准医学文本;
[0016]根据所述样本标准医学文本及所述非标准化医学文本的标签,对所述文本规范化模型进行训练

[0017]可选地,训练所述文本分析模型,具体包括:
[0018]获取样本医学文本;
[0019]根据所述样本医学文本中各医学实体之间的关系,对预先存储的知识图谱进行扩
充;
[0020]根据扩充后的知识图谱以及所述样本医学文本,对所述文本分析模型进行训练

[0021]可选地,获取样本医学文本,具体包括:
[0022]获取样本原始医学文本;
[0023]将所述样本原始医学文本输入预先训练的文本规范化模型,得到所述文本规范化模型输出的样本医学文本

[0024]可选地,根据扩充后的知识图谱以及所述样本医学文本,对所述文本分析模型进行训练,具体包括:
[0025]根据扩充后的知识图谱,确定所述样本医学文本的样本分析结果,作为所述样本医学文本的标签;
[0026]将所述样本医学文本输入文本分析模型,获得所述文本分析模型输出的针对所述样本医学文本的分析结果;
[0027]根据所述文本分析模型输出的针对所述样本医学文本的分析结果及所述样本医学文本的标签,对所述文本分析模型进行训练

[0028]可选地,根据所述文本分析模型输出的针对所述样本医学文本的分析结果及所述样本医学文本的标签,对所述文本分析模型进行训练,具体包括:
[0029]确定所述文本分析模型输出的针对所述样本医学文本的分析结果与所述样本医学文本的标签的差异;
[0030]根据所述差异,对所述文本分析模型进行训练

[0031]本说明书提供了一种医学文本的分析装置,所述装置包括:
[0032]原始医学文本获取模块,用于获取用户的原始医学文本;
[0033]标准医学文本确定模块,用于将所述原始医学文本输入预先训练的文本规范化模型,得到所述文本规范化模型输出的标准医学文本;
[0034]分析模块,用于将所述标准医学文本输入预先训练的文本分析模型,获得所述文本分析模型输出的针对所述标准医学文本的分析结果

[0035]可选地,所述原始医学文本包括影像所见

病例文本

[0036]可选地,所述文本规范化模型包括大规模语言模型;所述文本分析模型包括大规模语言模型

[0037]可选地,所述装置还包括:
[0038]文本规范化模型训练模块,用于获取非标准化医学文本;根据标准化医学语料库,确定所述非标准化医学文本的标准医学文本,作为所述非标准化医学文本的标签;将所述非标准化医学文本输入文本规范化模型,确定所述文本规范化模型输出的样本标准医学文本;根据所述样本标准医学文本及所述非标准化医学文本的标签,对所述文本规范化模型进行训练

[0039]可选地,所述装置还包括:
[0040]文本分析模型训练模块,用于获取样本医学文本;根据所述样本医学文本中各医学实体之间的关系,对预先存储的知识图谱进行扩充;根据扩充后的知识图谱以及所述样本医学文本,对所述文本分析模型进行训练

[0041]可选地,所述文本分析模型训练模块具体用于,获取样本原始医学文本;将所述样
本原始医学文本输入预先训练的文本规范化模型,得到所述文本规范化模型输出的样本医学文本

[0042]可选地,所述文本分析模型训练模块具体用于,根据扩充后的知识图谱,确定所述样本医学文本的样本分析结果,作为所述样本医学文本的标签;将所述样本医学文本输入文本分析模型,获得所述文本分析模型输出的针对所述样本医学文本的分析结果;根据所述文本分析模型输出的针对所述样本医学文本的分析结果及所述样本医学文本的标签,对所述文本分析模型进行训练

[0043]可选地,所述文本分析模型训练模块具体用于,确定所述文本分析模型输出的针对所述样本医学文本的分析结果与所述样本医学文本的标签的差异;根据所述差异,对所述文本分析模型进行训练

[0044]本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述医学文本的分析方法

[0045]本说明书提供了一种电子设备,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述医学文本的分析方法

[0046]本说明书采用的上述至少一个技术方案能够达到以下有益效果:
[0047]在本说明书提供的医学文本的分析方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种医学文本的分析方法,其特征在于,所述方法包括:获取用户的原始医学文本;将所述原始医学文本输入预先训练的文本规范化模型,得到所述文本规范化模型输出的标准医学文本;将所述标准医学文本输入预先训练的文本分析模型,获得所述文本分析模型输出的针对所述标准医学文本的分析结果
。2.
如权利要求1所述的方法,其特征在于,所述原始医学文本包括影像所见

病例文本
。3.
如权利要求1所述的方法,其特征在于,所述文本规范化模型包括大规模语言模型;所述文本分析模型包括大规模语言模型
。4.
如权利要求1所述的方法,其特征在于,训练所述文本规范化模型,具体包括:获取非标准化医学文本;根据标准化医学语料库,确定所述非标准化医学文本的标准医学文本,作为所述非标准化医学文本的标签;将所述非标准化医学文本输入文本规范化模型,确定所述文本规范化模型输出的样本标准医学文本;根据所述样本标准医学文本及所述非标准化医学文本的标签,对所述文本规范化模型进行训练
。5.
如权利要求1所述的方法,其特征在于,训练所述文本分析模型,具体包括:获取样本医学文本;根据所述样本医学文本中各医学实体之间的关系,对预先存储的知识图谱进行扩充;根据扩充后的知识图谱以及所述样本医学文本,对所述文本分析模型进行训练
。6.
如权利要求5所述的方法,其特征在于,获取样本医学文本,具...

【专利技术属性】
技术研发人员:顾冬冬王晟薛忠
申请(专利权)人:上海联影智能医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1