一种医学图像和医学报告配对训练模型制造技术

技术编号：40560845 阅读：9 留言：0更新日期：2024-03-05 19:23

本发明专利技术公布了一种医学图像和医学报告配对训练模型，该模型采用配准医学图像和医学报告的集合来实现训练，该综合训练模型的训练步骤如下：S1，图像编码；S2，文本编码；S3，注意力加权图像表示；S4，训练模型函数的建立，本发明专利技术可以从医学图像和医学报告中自动学习出有用的特征表示，通过联合学习医学图像和报告数据，模型能够捕获两者之间的复杂关系，提高数据的表征能力和信息提取效果，将现代深度学习技术引入医学领域，从而实现对多模态医学数据的整合分析，为临床诊断和疾病监测提供更精确和全面的支持。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及医疗信息处理，具体涉及一种医学图像和医学报告配对训练模型。

技术介绍

1、医学领域中的图像和文本数据积累急剧增加，这些数据源涵盖了从x射线和mri扫描到临床报告和病历记录的多种信息。这些数据既具有丰富的解剖和病理特征，又承载了医生的临床经验和专业判断。然而，有效地利用这些数据，特别是将医学图像和文本数据结合起来，仍然是医学领域面临的重要挑战之一。

2、医学图像的解读对于准确地进行临床诊断至关重要。然而，由于医学图像数据的多样性和复杂性，准确地识别病变、定位异常以及分析解剖结构需要医生丰富的经验和专业知识。此外，医疗文本也包含了大量有关患者病情、治疗方案以及医生诊断的重要信息。然而，将这两种数据类型相互关联和结合，从而提取更全面的信息，仍然存在挑战。

3、近年来，深度学习技术在医学图像和文本领域的应用逐渐增多。然而，目前的深度学习方法主要专注于单一模态的数据分析，而忽视了医学图像和文本之间的丰富关联性。为了充分利用多模态数据，特别是医学图像和文本配对数据，我们需要一种创新性的方法来实现联合分析和综合解读。

技术实现思路

1、为解决上述问题，本专利技术提供了一种医学图像和医学报告配对训练模型，本专利技术是通过以下技术方案来实现的。

2、一种医学图像和医学报告配对训练模型，该模型采用配准医学图像和医学报告的集合来实现训练，其中k表示配对的医学图像和医学报告的数量；

3、，其中ai和bi分别表示医学图像和医学报告，w和h分

4、其中，,；

5、该综合训练模型的训练步骤如下：

6、s1，图像编码，对医学图像进行分区，并对子区域进行编码，得到子区域的特征向量；

7、s2，文本编码，提取医学报告中的实体信息进行编码，以获取实体信息的嵌入表示；

8、s3，注意力加权图像表示，根据医学图像中各子区域相对于各医学报告的重要性来对医学图像的子区域进行加权处理，得到医学图像的最终表示；

9、s4，训练模型函数的建立。

10、优选的，所述步骤s1中，使用目标检测分割模型来识别医学图像中的关键实体区域和弱语义特征区域，并使用resnet-50 模型作为编码器对二者分别进行编码，得到f和，其中，f表示关键实体区域的特征向量，表示弱语义特征区域的特征向量，

11、，其中m表示每个医学图像上关键实体区域的个数，m为5；

12、通过resnet-50 模型的最终自适应平均池化层中提取的全局特征表示为fg。

13、优选的，所述步骤s2中，利用现有的 metamap 模型从医学报告中提取出实体信息，将提取到的实体信息表示为其中表示从对应报告提取到的实体信息，i，随后采用 bioclinicalbert 模型作为编码器记为，对实体信息进行编码，以获取实体信息以及整体报告的嵌入表示，具体如下：

14、

15、通过投影映射将上述表示映射为128维特征向量，即

16、。

17、优选的，所述步骤s3中，医学图像的最终表示ai为：

18、+，λ1和λ2为超参数且λ1+λ2=1。

19、优选的，

20、

21、其中为第i个医学图像上的关键实体区域基于医学报告的注意力加权；是第i个医学报告上的实体信息对第i个医学图像上第j个关键实体区域的影响，代表注意力权重；是与第i个医学报告配对的医学图像上的第j个关键实体区域的特征向量。

22、优选的，

23、其中，是一个超参数；对应于第个报告实体信息的嵌入表示与第i个医学图像中的第个子区域之间的相似性；

24、

25、其中，代表向量的转置。

26、优选的，该训练模型采用以下损失函数进行优化：

27、

28、其中，为一个权重函数，，z等于或，为超参数。

29、优选的，所述步骤s4中，将每个医学图像和对应的医学报告作为正样本对，将每个医学图像与其他的医学报告作为负样本对，最终得到对比学习中的带噪对比估计损失函数，该函数即为训练模型的函数：

30、

31、其中是用于控制弱语义负样本权重的超参数，其中neg表示每个图像与其他的检查报告形成的负样本对集合。

32、本专利技术可以从医学图像和医学报告中自动学习出有用的特征表示，通过联合学习医学图像和报告数据，模型能够捕获两者之间的复杂关系，提高数据的表征能力和信息提取效果，将现代深度学习技术引入医学领域，从而实现对多模态医疗数据的整合分析，为临床诊断和疾病监测提供更精确和全面的支持，本专利技术的有益效果如下：

33、弱语义特征的提取：通过提取带有弱语义信息的图像区域。有助于模型更好地捕捉局部低级特征，提高模型在处理医学图像等场景中的性能。

34、考虑局部特征：生成的弱语义负样本包含目标的局部特征和其他纹理特征，能够更全面地描述医学图像的局部结构，使模型能够更准确地理解图像的细节。

35、增强语义信息：将医学报告嵌入与医学图像表示结合，利用注意力机制加权图像表示，进一步提取与文本实体相关的重要区域。这有助于模型更好地捕捉医学图像中的语义信息。

36、强化图像－报告关联：通过计算医学图像子区域与医学报告之间的相似性，生成了注意力加权的图像表示。这有助于加强图像和报告之间的关联，提高模型在医学报告与图像之间的相似度计算能力。

37、对比学习框架：采用对比学习框架，通过比较正样本和负样本之间的差异来训练模型。这可以使模型在特征空间中更好地区分不同样本，提高模型的鲁棒性和性能。

本文档来自技高网...

【技术保护点】

1.一种医学图像和医学报告配对训练模型，其特征在于，该模型采用配准医学图像和医学报告的集合来实现训练，其中K表示配对的医学图像和医学报告的数量；

2.根据权利要求1所述的一种医学图像和医学报告配对训练模型，其特征在于，所述步骤S1中，使用目标检测分割模型来识别医学图像中的关键实体区域和弱语义特征区域，并使用ResNet-50 模型作为编码器对二者分别进行编码，得到f和，其中，f表示关键实体区域的特征向量，表示弱语义特征区域的特征向量；

3.根据权利要求2所述的一种医学图像和医学报告配对训练模型，其特征在于，所述步骤S2中，利用现有的 MetaMap 模型从医学报告中提取出实体信息，将提取到的实体信息表示为其中表示从对应报告提取到的实体信息，i，随后采用 BioClinicalBERT 模型作为编码器记为，对实体信息进行编码，以获取实体信息以及整体报告的嵌入表示，具体如下：

4.根据权利要求3所述的一种医学图像和医学报告配对训练模型，其特征在于，所述步骤S3中，医学图像的最终表示Ai为：

5.根据权利要求4所述的一种医学图像和医学

6.根据权利要求4所述的一种医学图像和医学报告配对训练模型，其特征在于，

7.根据权利要求6所述的一种医学图像和医学报告配对训练模型，其特征在于，该训练模型采用以下损失函数进行优化：

8.根据权利要求7所述的一种医学图像和医学报告配对训练模型，其特征在于，所述步骤S4中，将每个医学图像和对应的医学报告作为正样本对，将每个医学图像与其他的医学报告作为负样本对，最终得到对比学习中的带噪对比估计损失函数，该函数即为训练模型的函数：

...

【技术特征摘要】

1.一种医学图像和医学报告配对训练模型，其特征在于，该模型采用配准医学图像和医学报告的集合来实现训练，其中k表示配对的医学图像和医学报告的数量；

2.根据权利要求1所述的一种医学图像和医学报告配对训练模型，其特征在于，所述步骤s1中，使用目标检测分割模型来识别医学图像中的关键实体区域和弱语义特征区域，并使用resnet-50 模型作为编码器对二者分别进行编码，得到f和，其中，f表示关键实体区域的特征向量，表示弱语义特征区域的特征向量；

3.根据权利要求2所述的一种医学图像和医学报告配对训练模型，其特征在于，所述步骤s2中，利用现有的 metamap 模型从医学报告中提取出实体信息，将提取到的实体信息表示为其中表示从对应报告提取到的实体信息，i，随后采用 bioclinicalbert 模型作为编码器记为，对实...

【专利技术属性】
技术研发人员：马韵洁，宋国磊，王飞，王佐成，吴艳平，谢浩天，徐晓龙，
申请(专利权)人：数据空间研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人