一种医疗图像分类模型训练方法、医疗图像分类方法技术

技术编号：41228577 阅读：3 留言：0更新日期：2024-05-09 23:45

本发明专利技术提供一种医疗图像分类模型训练方法，包括：S1、从目标诊疗场景中采样多个诊疗错误的医疗图像以构建经验代价集，其中，所述经验代价集包括多个正常医疗图像和多个异常医疗图像，且每个正常医疗图像和每个异常医疗图像均对应一个误分类代价，所述误分类代价为其对应的正常医疗图像或异常医疗图像诊疗错误所造成的经济损失；S2、从所述目标诊疗场景中采样多个医疗图像以构建训练集，所述训练集中包括多个正常医疗图像和多个异常医疗图像，且所述每个正常医疗图像的标签为无病，所述每个异常医疗图像的标签为有病；S3、根据所述经验代价集确定分类阈值，并基于分类阈值采用所述训练集对医疗图像分类模型进行多轮迭代训练直至收敛。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习领域，具体来说，涉及深度学习领域中的医疗图像分类技术，更具体地说，涉及基于深度神经网络模型的医疗图像分类技术，即一种医疗图像分类模型训练方法、医疗图像分类方法。

技术介绍

1、近年来，深度学习已经成为人工智能领域最重要的技术之一。因强大的数据特征表达能力，深度神经网络模型已经被成功应用到众多视觉识别任务中并取得了显著的突破，如物体检测、语义分割和医疗图像分类等。深度神经网络模型的成功源于其大量的模型参数对任务模式的学习，而这一过程需要大量的标注数据进行模型训练。在传统的深度神经网络模型训练中，标注数据的类别分布往往受人为调整而变得均衡，即不同类别的样本数量无明显差别。

2、而在实际应用中，如医疗图像分类任务，自然采集的医疗图像数据类别通常表现为长尾分布，即一小部分医疗图像类别拥有大量的样本(正常医疗图像)，而其余的大部分类别只有较少的样本(异常医疗图像)。这样的数据分布特性会使得深度神经网络模型在训练的过程中，往往会过于关注拥有大量样本的类别(正常医疗图像)，而忽视拥有小部分样本的类别(异常医疗图像)。也就是说，在长尾数据下训练的深度神经网络模型容易偏向训练数据中的正常医疗图像，即正常医疗图像的特征空间往往大于异常医疗图像的特征空间，且分类决策边界(分类阈值)也会向正常医疗图像方向偏移以确保更好地分类正常医疗图像，这一现象会导致训练得到的深度神经网络模型在数量有限的的少数类(异常医疗图像)上表现不佳，即训练得到的深度神经网络模型更容易识别正常医疗图像，不易识别异常医疗图像，进而不利于执行医疗图像分类任务。

3、为了解决数据分布不均衡的问题(正常医疗图像和异常医疗图像的数据分布不平衡)，有研究人员提出可以通过auc指标来评估不同分类阈值下的深度神经网络模型的性能以得到在数据长尾分布下性能表现良好的深度神经网络模型。通过auc指标可以选择合适的区分正常医疗图像与异常医疗图像之间的分类阈值，使得深度神经网络模型既能充分学习到正常医疗图像的信息，也不会忽视异常医疗图像的信息。其中，所谓的auc指标是通过roc曲线下的面积来定义的，roc曲线的横坐标为假阳性率(fpr)，纵坐标为真阳性率(tpr)，其为不同分类阈值下一系列点(fpr，tpr)构成的曲线。深度神经网络模型预估的是0到1之间的概率，设定不同的分类阈值才能确定深度神经网络模型预测的是正常医疗图像还是异常医疗图像，即计算对应分类阈值下的假阳性率和真阳性率。从roc曲线上看，横轴(fpr)只关心异常医疗图像样本，与正常医疗图像样本无关；而纵轴(tpr)只关心正常医疗图像样本，与异常医疗图像样本无关，所以横纵轴都不受正常医疗图像和异常医疗图像数据分布影响。由此可知，auc指标对正常医疗图像和异常医疗图像的数据分布并不敏感，即使是在正常医疗图像和异常医疗图像数据分布不均衡的情况下，也能给出合理的评估结果，因此，auc指标成为了长尾学习的热门指标，被广泛用于评估训练数据长尾分布时深度神经网络模型的性能。基于此，许多与auc指标相关的优化方法被提出，比如，pauc优化方法、wauc优化方法等。

4、为了解决数据分布不均衡的问题，研究人员提出还可以基于代价敏感学习对深度神经网络模型进行训练，以获取数据长尾分布下性能表现良好的深度神经网络模型。代价敏感学习是一种常见的数据挖掘方法，其主要目标是将误分类代价纳入深度神经网络模型损失中，使得训练得到的深度神经网络模型与现实场景更为兼容。之所以要引入误分类代价，是因为若采用传统的训练方式对深度神经网络模型进行训练，那么训练得到的深度神经网络模型会偏向正常医疗图像，此时深度神经网络模型容易将异常医疗图像分类为正常医疗图像，且将一个异常医疗图像分类为正常医疗图像所造成的损失远远大于将正常医疗图像分类为异常医疗图像的损失。因此，在此种情况下，可以基于代价敏感学习将误分类代价纳入深度神经网络模型的损失中，即在计算迭代损失是增加一些约束和权重条件，使得深度神经网络模型在训练过程中既能充分学习到正常医疗图像样本的信息，也不会忽略异常医疗图像样本的信息。

5、虽然现有技术提出的方法能够解决数据分布不均衡的问题，但是无论是采用auc相关的优化方法还是采用代价敏感学习方法，训练得到的深度神经网络模型均存在缺陷。其中，采用auc相关的优化方法训练出来的深度神经网络模型在代价分布偏移的测试数据上的表现不佳；而采用代价敏感学习方法训练得到的深度神经网络模型仅能考虑特定的代价和数据类别不平衡的场景，在数据类别偏移的测试数据上的表现不佳。

技术实现思路

1、因此，本专利技术的目的在于克服上述现有技术的缺陷，提供一种医疗图像分类模型训练方法、一种医疗图像分类方法和一种医疗图像分类系统。

2、本专利技术的目的是通过以下技术方案实现的。

3、根据本专利技术的第一方面，提供一种医疗图像分类模型训练方法，所述方法包括：s1、从目标诊疗场景中采样多个诊疗错误的医疗图像以构建经验代价集，其中，所述经验代价集包括多个正常医疗图像和多个异常医疗图像，且每个正常医疗图像和每个异常医疗图像均对应一个误分类代价，所述误分类代价为其对应的正常医疗图像或异常医疗图像诊疗错误所造成的经济损失；s2、从所述目标诊疗场景中采样多个医疗图像以构建训练集，所述训练集中包括多个正常医疗图像和多个异常医疗图像，且所述每个正常医疗图像的标签为无病，所述每个异常医疗图像的标签为有病；s3、根据所述经验代价集确定分类阈值，并基于分类阈值采用所述训练集对医疗图像分类模型进行多轮迭代训练直至收敛。

4、在本专利技术的一些实施例中，在所述步骤s3中，每轮迭代训练包括：s31、从所述训练集中随机采样多个医疗图像得到当前轮第一数据集，并基于所述经验代价集和当前轮第一数据集进行多次内层迭代计算以得到当前轮分类阈值。

5、在本专利技术的一些实施例中，所述每次内层迭代计算包括：基于所述经验代价集和当前轮第一数据集按照预设的内层损失函数计算当前次内层迭代损失，并基于当前次内层迭代损失按照预设的梯度算子计算梯度信息以更新上一次内层迭代计算得到的分类阈值得到当前次分类阈值。

6、在本专利技术的一些实施例中，所述预设的内层损失函数为：

7、

8、其中，

9、

10、其中，表示内层损失函数，nτ表示经验代价集中所有医疗图像的误分类代价对应的分类阈值τ的数量，表示代价损失函数，w表示当前轮医疗图像分类模型的权重参数，τl表示cl对应的分类阈值，cl表示经验代价集中第l个医疗图像对应的误分类代价，τ表示分类阈值，c表示误分类代价，π表示当前轮第一数据集中正常医疗图像的比例，n+表示当前轮第一数据集中正常医疗图像的数量，pi表示当前轮第一数据集中第i个正常医疗图像的权重，n-表示当前轮第一数据集中异常医疗图像的数量，nj表示当前轮第一数据集中第j个异常医疗图像的权重，m′和m表示预设的正整数，ψ(·)表示softplus函数，s(·)表示医疗图像分类模型，表示当前轮医疗图像分类模型对正常医本文档来自技高网...

【技术保护点】

1.一种医疗图像分类模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述步骤S3中，每轮迭代训练包括：

3.根据权利要求2所述的方法，其特征在于，所述每次内层迭代计算包括：

4.根据权利要求3所述的方法，其特征在于，所述预设的内层损失函数为：

5.根据权利要求4所述的方法，其特征在于，在所述步骤S3中，每轮迭代训练还包括：

6.根据权利要求5所述的方法，其特征在于，所述预设的外层损失函数为：

7.一种医疗图像分类方法，其特征在于，所述方法包括：

8.一种医疗图像分类系统，其特征在于，所述系统包括：

9.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序可被处理器执行以实现权利要求1至7任一所述方法的步骤。

10.一种电子设备，其特征在于，包括：

【技术特征摘要】

1.一种医疗图像分类模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述步骤s3中，每轮迭代训练包括：

3.根据权利要求2所述的方法，其特征在于，所述每次内层迭代计算包括：

4.根据权利要求3所述的方法，其特征在于，所述预设的内层损失函数为：

5.根据权利要求4所述的方法，其特征在于，在所述步骤s3中，每轮迭代训练还包括：...

【专利技术属性】
技术研发人员：许倩倩，邵慧杨，温佩松，杨智勇，高培峰，黄庆明，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人