一种基于深度学习的分类器模型的训练方法技术

技术编号:27773162 阅读:27 留言:0更新日期:2021-03-23 12:58
本发明专利技术公开了一种基于深度学习的分类器模型的训练方法,包括:从第一数据集中的原始医学图像中获取感兴趣区域图像以形成第二数据集;对第二数据集的图像进行常规增强后得到初步扩充图像以形成第三数据集;利用生成式对抗网络模型的生成器生成对应感兴趣区域图像的进一步扩充图像以形成第四数据集;利用第二数据集的一部分图像训练分类器模型;分别利用第二数据集的另一部分图像、第三数据集、第四数据集验证模型的分类准确率并得到近似相等的准确率值q1、q2、q3;利用第二、第三及第四数据集重新训练分类器模型并得出准确率值q4,q4分别大于q1、q2或q3。本发明专利技术能够在保证图像深层次特征没改变的情况下扩充训练集,从而提高模型的分类准确率。

【技术实现步骤摘要】
一种基于深度学习的分类器模型的训练方法
本专利技术涉及人工智能
,更具体地,特别是指一种基于深度学习的分类器模型的训练方法。
技术介绍
在医学图像处理领域中,以往通过传统的统计建模方法来对医学图像(例如,CT图像)进行原始特征的采集提取,但是由于这种方法缺乏对图像的深层次特征的探索,所以往往模型的精准度较差,很难达到真正的图像病例分类的标准。随着人工智能技术的广泛应用,利用相关技术取代传统统计建模方法已成为必然趋势。近年来,已经有人提出了用深度学习的方法来学习图片的特征。深度学习可以较好的学习图片的深层次特征,但是要创建一个精度较高的深度学习模型需要极大的数据量进行模型训练来防止模型过拟合,达到很好的图像识别分类的效果。现有医学图像太少,那么为了达到理想的模型准确度,在训练深度学习模型之前需要扩充训练数据量。然而,现有技术无法在不改变图像深层次特征的情况下,扩充训练图像数据集,为模型的精确识别提供足够的数据基础。针对上述现有技术的缺陷,本领域亟待需要一种能够在不改变图像深层次特征的情况下扩充训练集图像,使深度学习模型得到充分训练以达到理想的分类识别准确度的方案。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提出一种基于深度学习的分类器模型的训练方法,能够解决上述现有技术无法在不改变图像深层次特征的情况下扩充训练图像数据集,导致深度学习模型得不到充分训练,达不到理想的分类识别准确度等问题。基于上述目的,本专利技术实施例的一方面提供了一种基于深度学习的分类器模型的训练方法,包括以下步骤:步骤1、根据预设分类标准对原始医学图像进行人工分类并添加分类标签,带有所述分类标签的所述原始医学图像组成第一数据集;步骤2、从所述第一数据集中的所述原始医学图像中获取感兴趣区域图像,所述感兴趣区域图像组成第二数据集;步骤3、对所述第二数据集中的所述感兴趣区域图像执行翻转、旋转、缩放操作以得到初步扩充图像,所述初步扩充图像组成第三数据集;步骤4、利用预先创建的基于深度神经网络的生成式对抗网络模型的生成器生成对应于所述感兴趣区域图像的进一步扩充图像,所述进一步扩充图像组成第四数据集;步骤5、利用所述第二数据集中的一部分感兴趣区域图像训练目标分类器模型;步骤6、利用所述第二数据集中的另一部分感兴趣区域图像验证所述目标分类器模型的准确率并得到分类准确率值q1,利用所述第三数据集验证所述目标分类器模型的准确率并得到分类准确率值q2,利用所述第四数据集验证所述目标分类器模型的准确率并得到分类准确率值q3,q2与q1之差的绝对值和q3与q1之差的绝对值均小于预设阈值;以及步骤7、将所述第二数据集、所述第三数据集以及所述第四数据集输入到所述目标分类器模型重新进行训练并得出分类准确率值q4,q4分别大于q1、q2或q3,其中,所述第二数据集、所述第三数据集以及所述第四数据集的数据量相等。在一些实施方式中,所述生成式对抗网络模型的训练过程为:基于所述第二数据集和预设随机分布噪声对所述生成式对抗网络模型的生成器和判别器进行交替训练。在一些实施方式中,基于所述第二数据集和预设随机分布噪声对所述生成式对抗网络模型的生成器和判别器进行交替训练,包括:生成步骤:固定所述判别器的参数,将所述预设随机分布噪声输入到所述生成器中以输出生成图像;判别步骤:固定所述生成器的参数,将所述生成图像和所述第二数据集输入到所述判别器中以输出真假概率值;优化步骤:将所述真假概率值传递到所述生成器,使用优化器优化所述判别器和所述生成器;重复所述生成步骤、所述判别步骤以及所述优化步骤,直到获得满足预设条件的损失函数值,得到训练好的生成器和判别器。在一些实施方式中,所述步骤4进一步包括:将所述预设随机分布噪声输入到所述训练好的生成器中生成所述进一步扩充图像。在一些实施方式中,所述预设随机分布噪声为100维随机高斯噪声。在一些实施方式中,所述第二数据集、所述第三数据集以及所述第四数据集中的图像均包含所述分类标签。在一些实施方式中,上述步骤2进一步包括:计算出所述第一数据集中的所述原始医学图像中的感兴趣区域;和将所述感兴趣区域从所述原始医学图像中裁剪出来作为所述感兴趣区域图像。在一些实施方式中,q1=q2=q3。本专利技术具有以下有益技术效果:本专利技术实施例提供的一种基于深度学习的分类器模型的训练方法,针对只有少量训练数据集的深度学习模型,能够在保证图像深层次特征没改变的情况下,通过裁剪选取感兴趣的区域,精准定位图像的深层特征,提高图像生成的效率,扩充训练集的图像,利用扩充的训练集图像训练深度学习模型,以便使其达到较高的识别准确度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。图1为根据本专利技术一个实施例的基于深度学习的分类器模型的训练方法的示意性流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。需要说明的是,本专利技术实施例中所有使用“第一”、“第二”、“第三”、“第四”等的表述均是为了区分多个相同名称非相同的实体或者非相同的参量,可见“第一”、“第二”、“第三”、“第四”等仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。基于上述目的,本专利技术提出了一种基于深度学习的分类器模型的训练方法的一个实施例。图1示出的是该训练方法的示意性流程图。该方法首先对原始图像进行裁剪,去掉没特征的区域,得到包含深层特征的感兴趣区域图像,后续基于感兴趣区域图像生成扩充图像,提高了有效图像的生成效率。本专利技术通过两种方式扩充训练集图像:其一是对感兴趣区域图像进行常规数据增强,得到一批扩充图像;其二是利用基于深度神经网络的生成式对抗网络的生成器模型生成逼近感兴趣区域图像的真实分布的另一批扩充图像。将两批扩充图像与感兴趣区域图像合在一起组成训练集来训练分类器模型,能够使其达到较高的识别准确度。具体而言,如图1中所示,该基于深度学习的分类器模型的训练方法包括以下步骤:步骤S1、根据预设分类标准对原始医学图像进行人工分类并添加分类标签,带有所述分类标签的所述原始医学图像组成第一数据集。步骤S2、从所述第一数据集中的所述原始医学图像中获取感兴趣区域图像,所述感兴趣区域图像组成第二数据集,所述感兴趣区域图像包含所述分类标签。步骤S3、对所述第二数据集中的所述感兴趣区域图像执行翻转、旋转(例如,图像60度、90度、120度、180度翻转,旋转)、缩放等常规数据增强操作以得到初步扩充图像,所述初步扩充图像组成第三数据集,所述初步扩充本文档来自技高网...

【技术保护点】
1.一种基于深度学习的分类器模型的训练方法,其特征在于,包括以下步骤:/n步骤1、根据预设分类标准对原始医学图像进行人工分类并添加分类标签,带有所述分类标签的所述原始医学图像组成第一数据集;/n步骤2、从所述第一数据集中的所述原始医学图像中获取感兴趣区域图像,所述感兴趣区域图像组成第二数据集;/n步骤3、对所述第二数据集中的所述感兴趣区域图像执行翻转、旋转、缩放操作以得到初步扩充图像,所述初步扩充图像组成第三数据集;/n步骤4、利用预先创建的基于深度神经网络的生成式对抗网络模型的生成器生成对应于所述感兴趣区域图像的进一步扩充图像,所述进一步扩充图像组成第四数据集;/n步骤5、利用所述第二数据集中的一部分感兴趣区域图像训练目标分类器模型;/n步骤6、利用所述第二数据集中的另一部分感兴趣区域图像验证所述目标分类器模型的准确率并得到分类准确率值q1,利用所述第三数据集验证所述目标分类器模型的准确率并得到分类准确率值q2,利用所述第四数据集验证所述目标分类器模型的准确率并得到分类准确率值q3,q2与q1之差的绝对值和q3与q1之差的绝对值均小于预设阈值;以及/n步骤7、将所述第二数据集、所述第三数据集以及所述第四数据集输入到所述目标分类器模型重新进行训练并得出分类准确率值q4,q4分别大于q1、q2或q3,/n其中,所述第二数据集、所述第三数据集以及所述第四数据集的数据量相等。/n...

【技术特征摘要】
1.一种基于深度学习的分类器模型的训练方法,其特征在于,包括以下步骤:
步骤1、根据预设分类标准对原始医学图像进行人工分类并添加分类标签,带有所述分类标签的所述原始医学图像组成第一数据集;
步骤2、从所述第一数据集中的所述原始医学图像中获取感兴趣区域图像,所述感兴趣区域图像组成第二数据集;
步骤3、对所述第二数据集中的所述感兴趣区域图像执行翻转、旋转、缩放操作以得到初步扩充图像,所述初步扩充图像组成第三数据集;
步骤4、利用预先创建的基于深度神经网络的生成式对抗网络模型的生成器生成对应于所述感兴趣区域图像的进一步扩充图像,所述进一步扩充图像组成第四数据集;
步骤5、利用所述第二数据集中的一部分感兴趣区域图像训练目标分类器模型;
步骤6、利用所述第二数据集中的另一部分感兴趣区域图像验证所述目标分类器模型的准确率并得到分类准确率值q1,利用所述第三数据集验证所述目标分类器模型的准确率并得到分类准确率值q2,利用所述第四数据集验证所述目标分类器模型的准确率并得到分类准确率值q3,q2与q1之差的绝对值和q3与q1之差的绝对值均小于预设阈值;以及
步骤7、将所述第二数据集、所述第三数据集以及所述第四数据集输入到所述目标分类器模型重新进行训练并得出分类准确率值q4,q4分别大于q1、q2或q3,
其中,所述第二数据集、所述第三数据集以及所述第四数据集的数据量相等。


2.根据权利要求1所述的基于深度学习的分类器模型的训练方法,其特征在于,所述生成式对抗网络模型的训练过程为:基于所述第二数据集和预设随机分布噪声对所述生成式对抗网络模型的生成器和判别器进行交替训练。

<...

【专利技术属性】
技术研发人员:谭海宁沈建雄戎天华冯尔维
申请(专利权)人:中国医学科学院北京协和医院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1