System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种超声诊断记录标准化方法技术_技高网

一种超声诊断记录标准化方法技术

技术编号:42664110 阅读:22 留言:0更新日期:2024-09-10 12:20
本发明专利技术涉及诊断记录标准化,公开了一种超声诊断记录标准化方法,包括以下步骤:步骤S101,扫描超声医疗诊断文本数据,生成待处理文本数据;步骤S102,对待处理文本数据进行预处理,通过第一深度学习模型识别待处理文本数据中的预测医疗实体;步骤S103,提取医疗实体之间的语义关系。本发明专利技术通过构建第一深度学习模块对待处理文本数据进行分析,得到医疗实体,构建第二深度学习模块对医疗实体之间的关系进行分析,并根据第一深度学习模块和第二深度学习模块的综合损失值优化第一深度学习模块的识别精度,相较于一般的标准化方法来说,结合了上下文和医疗实体之间的关系,对医疗实体的识别精度更高。

【技术实现步骤摘要】

本专利技术涉及诊断记录标准化,更具体地说,它涉及一种超声诊断记录标准化方法


技术介绍

1、既往的超声检查的图文报告存在数据记录、诊断字段命名、描述语义不统一、不规范的问题,不论是国内医院或是医学研究机构均没有特定的命名规则规范,这就导致以下问题:

2、1、报告的数据记录、描述术语、诊断结论不规范严格;

3、2、报告解读存在差异;

4、3、不能形成规范化的标准数据或可供计算机解读的“有效”的“大数据”,不利于数据交流、存储和分析,不利于计算机辅助诊断或者ai深度学习。


技术实现思路

1、本专利技术提供一种超声诊断记录标准化方法,解决上述技术问题。

2、本专利技术提供了一种超声诊断记录标准化方法,包括以下步骤:

3、步骤s101,扫描超声医疗诊断文本数据,生成待处理文本数据;

4、步骤s102,对待处理文本数据进行预处理,通过第一深度学习模型识别待处理文本数据中的预测医疗实体;

5、医疗实体包括:器官名称、疾病名称和检查结果;

6、步骤s103,提取医疗实体之间的语义关系;

7、步骤s104,基于医疗实体之间的语义关系优化第一深度学习模型识别待处理文本数据中的预测医疗实体的精度;

8、步骤s105,设置预定义的结构化模板,将步骤s102得出的识别结果输入预定义的结构化模板,生成标准化诊断报告。

9、进一步地,对待处理文本数据进行预处理包括:去除停用词、无关字符和标点符号;通过现有的文本处理工具去除待处理文本数据中的停用词、无关字符和标点符号。

10、进一步地,识别待处理文本数据中的预测医疗实体的步骤如下:

11、步骤s201,对预处理后的待处理文本中的每个词转化为词向量表示,可以采用词嵌入模型进行处理;

12、步骤s202,将预处理后的每个词向量输入第一深度学习模型,输出每个词表示预测的医疗实体。

13、进一步地,第一深度学习模型包括一个第一隐藏层和一个分类器;

14、第n个词向量输入第一隐藏层的第n个隐藏单元,输出第一更新特征;

15、第一更新特征输入分类器,输出每个词表示预测的医疗实体。

16、进一步地,用于训练第一深度学习模型的训练样本通过以往的超声医疗诊断文本数据获得,一个训练样本包括一个训练数据和一个样本标签。

17、进一步地,第一深度学习模型的计算公式如下:

18、第一隐藏层的第i个隐藏单元的公式包括:

19、

20、式中,attention(qi,ki,vi)表示第一隐藏层第i个隐藏单元输出的更新特征;qi、ki和vi分别表示第一隐藏层第i个隐藏单元的第一转换特征、第二转换特征和第三转换特征;wi1、wi2和wi3分别表示第一隐藏层第i个隐藏单元的第一权重参数、第二权重参数和第三权重参数;softmax表示softmax激活函数。

21、进一步地,提取医疗实体之间的语义关系的步骤如下:

22、步骤s301,将识别出来的医疗实体进行对齐,构建潜在的医疗实体对列表;

23、步骤s302,提取医疗实体对列表中每对医疗实体的上下文特征;

24、步骤s303,构建关系标签集,利用第二深度学习模型对每对医疗实体进行关系分类,第二深度学习模型利用第一深度学习模型的思想构建。

25、进一步地,优化第一深度学习模型识别待处理文本数据中的预测医疗实体的精度的步骤如下:

26、步骤s401,计算第一深度学习模型的交叉熵损失值,其计算公式如下:

27、lt=-ytlog(pt);

28、式中,lt表示在第t个词向量的真实医疗实体和第一深度学习模型输出的预测医疗实体的交叉熵损失值;yt表示真实医疗实体在第t个词向量位置的独热编码;pt表示第一深度学习模型输出的预测医疗实体和真实医疗实体相同的概率;

29、

30、式中,lzt表示待处理文本数据中真实医疗实体和第一深度学习模型输出的预测医疗实体的整体交叉熵损失值;t表示待处理文本数据的词向量长度;

31、步骤s402,计算第二深度学习模型输出的预测医疗实体对之间的关系和实际的医疗实体对之间的关系的损失值,其计算公式如下:

32、lr(a,b)=-logp(r∣a,b);

33、式中,a和b分别表示医疗实体a和医疗实体b;lr(a,b)表示第二深度学习模型输出的预测医疗实体a和医疗实体b之间的关系和实际的医疗实体a和医疗实体b之间的关系的损失值;p(r∣a,b)表示第二深度学习模型输出的预测医疗实体对之间的关系和实际的医疗实体对之间的关系相同的概率;r表示实际的医疗实体对之间的关系;

34、lzr=∑(a,b)∈z-logp(r∣a,b);

35、式中,lzr表示第二深度学习模型输出的预测医疗实体对之间的关系和实际的医疗实体对之间的关系的整体损失值;z表示待处理文本数据中的所有医疗实体关系对;

36、步骤s403,对lzt和lzr求和,得到第一深度学习模型和第二深度学习模型的整体损失值,其计算公式如下:

37、lz=lzt+λlzr;

38、式中,lz表示第一深度学习模型和第二深度学习模型的整体损失;λ表示调节lzt和lzr权重的超参数;

39、步骤s404,根据第一深度学习模型和第二深度学习模型的整体损失值对第一深度学习模型的精度进行优化。

40、进一步地,预定义的结构化模板包括15个子标准,分别为:信息,肝脏、胆囊、胰腺、脾脏、肾脏、甲状腺、心脏、乳腺、颈部血管、膀胱、四肢血管、生殖、妇产、前列腺;

41、各子标准顺序排列,按大写英文字母a、b、c…o分别顺序标注子标准字段名。

42、本专利技术的有益效果在于:通过构建第一深度学习模块对待处理文本数据进行分析,得到医疗实体,构建第二深度学习模块对医疗实体之间的关系进行分析,并根据第一深度学习模块和第二深度学习模块的综合损失值优化第一深度学习模块的识别精度,相较于一般的标准化方法来说,结合了上下文和医疗实体之间的关系,对医疗实体的识别精度更高。

本文档来自技高网...

【技术保护点】

1.一种超声诊断记录标准化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种超声诊断记录标准化方法,其特征在于,对待处理文本数据进行预处理包括:去除停用词、无关字符和标点符号。

3.根据权利要求2所述的一种超声诊断记录标准化方法,其特征在于,识别待处理文本数据中的预测医疗实体的步骤如下:

4.根据权利要求3所述的一种超声诊断记录标准化方法,其特征在于,第一深度学习模型包括一个第一隐藏层和一个分类器;

5.根据权利要求4所述的一种超声诊断记录标准化方法,其特征在于,用于训练第一深度学习模型的训练样本通过以往的超声医疗诊断文本数据获得,一个训练样本包括一个训练数据和一个样本标签。

6.根据权利要求5所述的一种超声诊断记录标准化方法,其特征在于,第一深度学习模型的计算公式如下:

7.根据权利要求6所述的一种超声诊断记录标准化方法,其特征在于,提取医疗实体之间的语义关系的步骤如下:

8.根据权利要求7所述的一种超声诊断记录标准化方法,其特征在于,优化第一深度学习模型识别待处理文本数据中的预测医疗实体的精度的步骤如下:

9.根据权利要求1所述的一种超声诊断记录标准化方法,其特征在于,预定义的结构化模板包括15个子标准,分别为:信息,肝脏、胆囊、胰腺、脾脏、肾脏、甲状腺、心脏、乳腺、颈部血管、膀胱、四肢血管、生殖、妇产、前列腺;

...

【技术特征摘要】

1.一种超声诊断记录标准化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种超声诊断记录标准化方法,其特征在于,对待处理文本数据进行预处理包括:去除停用词、无关字符和标点符号。

3.根据权利要求2所述的一种超声诊断记录标准化方法,其特征在于,识别待处理文本数据中的预测医疗实体的步骤如下:

4.根据权利要求3所述的一种超声诊断记录标准化方法,其特征在于,第一深度学习模型包括一个第一隐藏层和一个分类器;

5.根据权利要求4所述的一种超声诊断记录标准化方法,其特征在于,用于训练第一深度学习模型的训练样本通过以往的超声医疗诊断文本数据获得,一个训练样本包括一个训练...

【专利技术属性】
技术研发人员:李利刘淑萍赵国政林榕徐娟
申请(专利权)人:中国人民解放军空军特色医学中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1