一种基于不平衡数据的乳腺癌影像多任务分类方法和系统技术方案

技术编号:39819929 阅读:14 留言:0更新日期:2023-12-22 19:39
本发明专利技术公开了一种基于不平衡数据的乳腺癌影像多任务分类方法及系统,该方法首先获取超声乳腺癌影像和

【技术实现步骤摘要】
一种基于不平衡数据的乳腺癌影像多任务分类方法和系统


[0001]本专利技术属于医学影像分类领域,具体涉及一种基于不平衡数据的乳腺癌影像多任务分类方法和系统


技术介绍

[0002]乳腺癌已经成为最常见的恶性肿瘤,乳腺癌早期筛查可以提高其早期诊断率

降低病死率,因此亟需提升早期筛查水平

乳腺癌可以使用
X
射线检查

超声波检查和磁共振成像

计算机断层扫描
(CT)、
端口发射断层扫描
(PET)、
乳房温度测量等方法检测

早期的乳腺癌诊断可以降低死亡率并增加生存率,可以通过精确检测和诊断恶性肿瘤进行早期干预以降低死亡率

然而,影像学检查对于更全面地评估癌变区域和识别癌症亚型的灵敏度较低

通过乳腺活检进行组织病理学成像也可以准确识别癌症亚型和精确定位病灶

但是这种由病理学家进行的人工检查低效且容易出错

因此,乳腺癌诊断的自动化方法是有必要的

[0003]目前,研究人员提出了多种基于人工智能的乳腺癌早期筛查算法


ImageNet
上预训练的模型转移到微调乳腺肿块分类模型中,这是小型或中型数据的一种常见方法

一些研究人员将
BUS
图像转换为具有
BI

RADS
>特征的特征图

特征图用于在半监督学习下对乳腺肿瘤进行分类,并在无监督学习下重建病变分类引导的特征图,或者提出了一种分层特征聚合分支来融合两个分支的特征并进行推理,设计了两个相同的
CNN
主干来分别识别恶性肿瘤和实体结节,使用两个
CNN
主干生成的类激活图相互引导

上述方法中基于
ImageNet
的预训练没有考虑到数据集样本均衡问题,只使用
BI

RADS
或者两个
CNN
进行训练,模型习得的特征又很单一,基于不平衡数据的乳腺癌影像多任务分类方法和系统解决了上述问题

[0004]实际上,卷积神经网络在医学数据集上实施的过程中会遇到如下的几个挑战:
[0005](1)
数据量少,由于医学数据收集时对保护病人的隐私方面的考虑,难以收集到充足的数据,一些机构的数据也并不会公开发布,如果数据量很少,那么训练模型的时候的泛化性就会很差,导致过拟合现象

[0006](2)
多重样本数量不均衡,样本的类别的数量不均衡,模型对样本数量较多的类别表现较好,对样本数量较少的类别表现能力较差,最终会输出一个不能正确表示准确性的结果

[0007](3)
数据维度单一,大多数医学图像只有图片信息,不会携带有文本信息,病理报告的获取也十分困难

[0008](4)
训练网络所使用的时间和硬件成本太高,卷积神经网络往往有百万级别的参数,无法普及到低层次的设备


技术实现思路

[0009]本专利技术提供一种基于不平衡数据的乳腺癌影像多任务分类方法,以解决医学数据
各个类别不平衡以至于泛化性不好的问题

提出一种多任务训练策略,模拟现实中医生依据影像诊断肿瘤时结合肿瘤的形状,大小,纵横比信息进行判断,让模型充分学习病灶和病灶周围信息的关联,以提高模型对于肿瘤良恶性分类的准确率

本专利技术能够在乳腺癌影像上得出可靠的分类结果,有效的辅助医生进行肿瘤判断,提高医生诊疗效率

[0010]本专利技术的目的是通过以下技术方案实现的:一种基于不平衡数据的乳腺癌影像多任务分类方法,该方法包括以下步骤:
[0011]S1、
获取超声乳腺癌影像和
CT
影像,构建数据集

超声影像和
CT
影像提供两份标签文件,一份是由活检得出的肿瘤的良恶性标签,另一份是由医生根据经验判断得出的肿瘤级别的
BI

RADS
评估标签,根据
BI

RADS
的6个等级把数据集放到6个文件夹中,称为数据集1,分配0‑5标签,根据良恶性两个等级,把数据集放到两个文件夹中,称为数据集2,良性肿瘤分配0标签,恶性肿瘤分配1标签;
[0012]S2、

S1
步骤中得到的每一张乳腺癌影像和
CT
影像使用模糊,水平翻转,随机截取,并把单通的灰度图变为三通,最终获得同一张乳腺癌图片的不同表现形式,进行数据增强,提高模型的泛化能力;
[0013]S3、
使用平衡损失函数处理不同数量的乳腺癌类别以平衡模型对各个类别的学习能力,把不同类别的乳腺癌影像的数量作为权重输入到损失函数中,用来调节模型对不同乳腺癌类别的学习能力;
[0014]S4、
构建特征提取模块,把二分类和六分类的网络进行联合训练,并把二分类和六分类的网络进行解耦训练,把联合训练作为任务1,把解耦训练作为任务2,最后把两个任务提取的特征融合进行分类以提高二分类的性能;
[0015]S5、
使用
S2
中获得的图像训练
S4
中得到的网络模型,生成对乳腺癌进行以
BI

RADS
为标签的六分类和以良恶性为标签的二分类网络模型,并把两个模型的特征融合进行联合模型的训练,把联合训练中的二分类当作生成器,把六分类当作判别器,训练一个对抗生成网络
GAN
模型,把训练出来的联合模型和
GAN
模型用一个二分类的分类头衔接起来,微调分类头
(
冻结住权重训练一个二分类的分类头
)

[0016]S6、
获取拥有标签的乳腺癌影像,输入
S5
中训练得到的网络模型,输出该乳腺癌影像中病灶区域良恶性的判断结果

[0017]步骤
S1
中,步骤
S1
中,对不同患者的超声影像或者
CT
影像根据模型要求构造标签的具体方法为:根据
BI

RADS
的划分等级为2,3,
4A

4B

4C
,5,给这六个等级分配的标签为0,1,2,3,4,
5。
根据良恶性的划分,给良性肿瘤标签为0,恶性肿瘤标签为
1。
[0018]步骤
S2
中,对每一份乳腺癌影像处理的具体方法为:根据乳腺癌影像中病灶中心裁剪获得统一大小的灰度图,使用高斯噪声去模糊图像,然后进行中心本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于不平衡数据的乳腺癌影像多任务分类方法,其特征在于,包括以下步骤:
S1、
获取超声乳腺癌影像和
CT
影像,构建数据集;数据集中,根据
BI

RADS
评估标签的等级分为六类,根据良恶性分为两类;
S2、
对得到的每一张乳腺癌影像和
CT
影像,进行数据增强;
S3、
使用平衡损失函数处理不同数量的乳腺癌类别,并把不同类别的乳腺癌影像的数量作为权重输入到损失函数中;
S4、
构建特征提取模块,将二分类和六分类的网络均进行联合训练和解耦训练,联合训练作为任务1,解耦训练作为任务2,把两个任务提取的特征融合进行分类;
S5、
使用
S2
中获得的图像训练
S4
中得到的网络模型,进行训练;
S6、
获取拥有标签的乳腺癌影像,输入
S5
中训练得到的网络模型,输出该乳腺癌影像中病灶区域良恶性的判断结果
。2.
根据权利要求1所述的基于不平衡数据的乳腺癌影像多任务分类方法,其特征在于,在
S1
中所述超声乳腺癌影像和
CT
影像提供两份标签文件,一份是由活检得出的肿瘤的良恶性标签,另一份是由医生根据经验判断得出的肿瘤级别的
BI

RADS
评估标签,根据
BI

RADS
的6个等级把数据集放到6个文件夹中,称为数据集1,分配0‑5标签,根据良恶性两个等级,把数据集放到两个文件夹中,称为数据集2,良性肿瘤分配0标签,恶性肿瘤分配1标签
。3.
根据权利要求1所述的基于不平衡数据的乳腺癌影像多任务分类方法,其特征在于,在
S2
中所述数据增强具体包括:根据乳腺癌影像中病灶中心裁剪获得统一大小的灰度图,使用高斯噪声去模糊图像,然后进行中心裁剪和随机翻转,并把单通道的灰度图转换成三通道
。4.
根据权利要求1所述的基于不平衡数据的乳腺癌影像多任务分类方法,其特征在于,在
S3
中,还包括:对于在
S2
中获得的每个患者的灰度图,统计二分类和六分类中各个类别的数量的信息当成平衡损失函数的权重,在使用时将平衡损失函数与交叉熵损失函数相加
。5.
根据权利要求1所述的基于不平衡数据的乳腺癌影像多任务分类方法,其特征在于,在
S4
中,所述特征提取模块为
DenseNet121
网络或者为
SwinTransformer_Tiny
网络,该网络的参数均为随机初始化生成,二分类模型和六分类模型的架构均为
CNN
或者<...

【专利技术属性】
技术研发人员:庞雪倩高飞葛瑞泉徐岗
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1