基于Pix2pix和Resnet50的图像识别分类方法、终端设备及存储介质技术

技术编号:36806833 阅读:17 留言:0更新日期:2023-03-09 00:20
本发明专利技术涉及深度学习与医疗图像技术处理技术领域,具体涉及一种基于Pix2pix和Resnet50的图像识别分类方法、终端设备及存储介质,包括将原始数据训练样本输入进搭建好的pix2pix网络中的Unet生成网络中,pix2pix的生成器会生成重新染色的图像,将生成的图像与对应的灰度切片拼接成生成图像对,将真实的图像与对应的灰度图配对,将真实配对图像与生成配对图像输入到判别器中进行判断,得到接近真实图像的生成图像;将生成的伪图像与真实图像样本混合输入到Resnet50网络中进行训练,得到最优模型。本发明专利技术采用pix2pix架构对切片颜色归一化的方法,减少染色不佳对分类识别精度的影响;提高了浸润性导管癌切片的识别率。提高了浸润性导管癌切片的识别率。提高了浸润性导管癌切片的识别率。

【技术实现步骤摘要】
基于Pix2pix和Resnet50的图像识别分类方法、终端设备及存储介质


[0001]本专利技术涉及深度学习与医疗图像技术处理
,尤其涉及一种基于Pix2pix和Resnet50的图像识别分类方法、终端设备及存储介质。

技术介绍

[0002]目前,根据世界卫生组织(WHO)统计,2020年,全球有230万名妇女被诊断患有乳腺癌,有68.5万人死亡。在病理类型上,乳腺癌可分为非浸润性乳腺癌、浸润性非特殊癌、浸润性特殊癌、其他罕见癌。而浸润性导管癌属于浸润性非特殊癌的一种,在乳腺癌病理类型中是最为常见的一种,是乳腺导管系统上皮细胞在多种致癌因子的作用下,发生了增殖入侵乳腺间质,并在间质内形成的病灶。
[0003]乳腺癌是女性群体最常见的癌症,浸润性导管癌(Invasiveductalcarcinoma,IDC)是最常见的乳腺癌。早发现、早诊断、早治疗是提高疗效的关键,准确识别和分类乳腺癌亚型是一项十分重要的临床任务。自动化辅助诊断的方法可用于节省时间和减少识别错误率,帮助医生提高诊断效率以及准确率。随着医学影像技术和深度学习计算机视觉的发展,为乳腺癌的快速、精准的诊断提供便利。
[0004]对于传统的机器学习分类算法来识别乳腺癌的阳性或阴性样本,包括:逻辑回归、随机森林、K近邻、支持向量机、高斯朴素贝叶斯、决策树分类器等,在乳腺癌自动识别领域取得了一定的成效,但是在效果上还尚有提升空间。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提出一种基于Pix2pix和Resnet50的图像识别分类方法、终端设备及存储介质,以解决传统的算法识别效果不佳的问题。
[0006]基于上述目的,本专利技术提供了一种基于Pix2pix和Resnet50的图像识别分类方法,包括:
[0007]S1:将数据集转换为灰度图,并将灰度图与原图像拼接配对,得到真实的图像对,并组成训练集;
[0008]S2:构建pix2pix架构,通过S1所述训练集对pix2pix模型进行训练,进行染色归一化处理;
[0009]S3:将经过步骤S2生成的图像与整理的数据混合组成新的数据集;
[0010]S4:将所述数据集输入到Resnet50模型中进行训练分类;
[0011]S5:在验证集上测试S4步骤中的模型精度。
[0012]可选的,所述将数据集转换为灰度图,并将灰度图与原图像拼接配对,得到真实的图像对,并组成训练集,具体包括:
[0013]将所述数据集划分为训练样本集和测试样本集,对每个样本进行转为灰度图操作,基于每个灰度图像样本和对应的彩色图像样本进行拼接后得到新的图像样本对,并将
其组建成训练集。
[0014]可选的,步骤S2中构建pix2pix模型时,使用cGAN网络,cGAN的损失函数如下:
[0015][0016]其中,G代表生成器,D代表判别器,x代表真实数据,z代表输入的噪声,y代表对应的标签;
[0017]使用的pix2pix模型是cGAN的拓展,对于pix2pix中的生成器应使用L1正则,生成器的损失函数如下:
[0018][0019]将生成器的损失函数公式的L1正则化过程添加到cGAN的损失函数公式中,便可得到pix2pix的损失函数,如下所示:
[0020][0021]其中,λ表示控制权重的超参数,训练目标是最大化生成器和最小化判别器,在二者博弈的过程中,得到最佳损失值。
[0022]可选的,所述将所述数据集输入到Resnet50模型中进行训练分类,包括:
[0023]将数据集进行数据增强后输入到Resnet50模型中训练,经过大量实验得到最佳的优化器、学习率和batch;最终,得到最优的Resnet50模型。
[0024]可选的,得到的所述最优的Resnet50模型在随机的抽取的验证集中验证以测试模型的性能,性能指标公式如下所示:
[0025][0026][0027][0028][0029]其中,TP为真阳性,TN为真阴性,FP为假阳性,FN为假阴性,ACC为准确率,Recall为召回率,Precision为精准度,F1

Score为调和平均数。
[0030]基于上述实施方式,还提出一种图像识别终端设备,包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
[0031]基于上述实施方式,还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
[0032]本专利技术的有益效果:通过使用基于pix2pix和Resnet50检测浸润性导管癌上的方法能够对乳腺癌切片进行良恶性识别,一定程度上能够帮助医生避免主观上对恶性切片的错误判断,以免造成误诊或者漏诊的请况的发生,一定程度上提高诊断效率。
附图说明
[0033]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1为本专利技术具体实施例的基于pix2pix和Resnet50的图像识别分类方法的流程图;
[0035]图2为本专利技术具体实施例的基于pix2pix和Resnet50的图像识别分类方法的系统结构图;
[0036]图3为本专利技术实施例的pix2pix模型中采用了D_real损失函数的变化曲线图;
[0037]图4为本专利技术实施例的pix2pix模型中采用了D_fake损失函数的变化曲线图;
[0038]图5为本专利技术实施例的pix2pix模型中采用了G_GAN损失函数的变化曲线图;
[0039]图6为本专利技术实施例的pix2pix模型中采用了G_L1损失函数的变化曲线图;
[0040]图7为本专利技术实施例的Resnet50网络在训练时的损失函数图;
[0041]图8为本专利技术实施例的最优模型在验证集上的混淆矩阵图。
具体实施方式
[0042]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本专利技术进一步详细说明。
[0043]需要说明的是,除非另外定义,本专利技术使用的技术术语或者科学术语应当为本专利技术所属领域内具有一般技能的人士所理解的通常意义。本专利技术中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Pix2pix和Resnet50的图像识别分类方法,其特征在于,包括如下步骤:S1:将数据集转换为灰度图,并将灰度图与原图像拼接配对,得到真实的图像对,并组成训练集;S2:构建pix2pix架构,通过S1所述训练集对pix2pix模型进行训练,进行染色归一化处理;S3:将经过步骤S2生成的图像与整理的数据混合组成新的数据集;S4:将所述数据集输入到Resnet50模型中进行训练分类;S5:在验证集上测试S4步骤中的模型精度。2.根据权利要求1所述的基于Pix2pix和Resnet50的图像识别分类方法,其特征在于,所述将数据集转换为灰度图,并将灰度图与原图像拼接配对,得到真实的图像对,并组成训练集,具体包括:将所述数据集划分为训练样本集和测试样本集,对每个样本进行转为灰度图操作,基于每个灰度图像样本和对应的彩色图像样本进行拼接后得到新的图像样本对,并将其组建成训练集。3.根据权利要求1所述的基于Pix2pix和Resnet50的图像识别分类方法,其特征在于,步骤S2中构建pix2pix模型时,使用cGAN网络,cGAN的损失函数如下:其中,G代表生成器,D代表判别器,x代表真实数据,z代表输入的噪声,y代表对应的标签;使用的pix2pix模型是cGAN的拓展,对于pix2pix中的生成器应使用L1正则,生成器的损失函数如下:将生成器的损失函数公式的L1正则化过程添加到cGAN...

【专利技术属性】
技术研发人员:李波雨程桂花任娜娜陈付龙吴青山
申请(专利权)人:安徽师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1