一种基于深度学习的分类器模型的训练方法技术

技术编号：27773162 阅读：27 留言：0更新日期：2021-03-23 12:58

本发明专利技术公开了一种基于深度学习的分类器模型的训练方法，包括：从第一数据集中的原始医学图像中获取感兴趣区域图像以形成第二数据集；对第二数据集的图像进行常规增强后得到初步扩充图像以形成第三数据集；利用生成式对抗网络模型的生成器生成对应感兴趣区域图像的进一步扩充图像以形成第四数据集；利用第二数据集的一部分图像训练分类器模型；分别利用第二数据集的另一部分图像、第三数据集、第四数据集验证模型的分类准确率并得到近似相等的准确率值q1、q2、q3；利用第二、第三及第四数据集重新训练分类器模型并得出准确率值q4，q4分别大于q1、q2或q3。本发明专利技术能够在保证图像深层次特征没改变的情况下扩充训练集，从而提高模型的分类准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的分类器模型的训练方法
本专利技术涉及人工智能
，更具体地，特别是指一种基于深度学习的分类器模型的训练方法。
技术介绍
在医学图像处理领域中，以往通过传统的统计建模方法来对医学图像(例如，CT图像)进行原始特征的采集提取，但是由于这种方法缺乏对图像的深层次特征的探索，所以往往模型的精准度较差，很难达到真正的图像病例分类的标准。随着人工智能技术的广泛应用，利用相关技术取代传统统计建模方法已成为必然趋势。近年来，已经有人提出了用深度学习的方法来学习图片的特征。深度学习可以较好的学习图片的深层次特征，但是要创建一个精度较高的深度学习模型需要极大的数据量进行模型训练来防止模型过拟合，达到很好的图像识别分类的效果。现有医学图像太少，那么为了达到理想的模型准确度，在训练深度学习模型之前需要扩充训练数据量。然而，现有技术无法在不改变图像深层次特征的情况下，扩充训练图像数据集，为模型的精确识别提供足够的数据基础。针对上述现有技术的缺陷，本领域亟待需要一种能够在不改变图像深层次特征的情况下扩充训练集图像，使深度学习模型得到充分训练以达到理想的分类识别准确度的方案。
技术实现思路
有鉴于此，本专利技术实施例的目的在于提出一种基于深度学习的分类器模型的训练方法，能够解决上述现有技术无法在不改变图像深层次特征的情况下扩充训练图像数据集，导致深度学习模型得不到充分训练，达不到理想的分类识别准确度等问题。基于上述目的，本专利技术实施例的一方面提供了一种基于深度学习的分类器模型的训...

【技术保护点】
1.一种基于深度学习的分类器模型的训练方法，其特征在于，包括以下步骤：/n步骤1、根据预设分类标准对原始医学图像进行人工分类并添加分类标签，带有所述分类标签的所述原始医学图像组成第一数据集；/n步骤2、从所述第一数据集中的所述原始医学图像中获取感兴趣区域图像，所述感兴趣区域图像组成第二数据集；/n步骤3、对所述第二数据集中的所述感兴趣区域图像执行翻转、旋转、缩放操作以得到初步扩充图像，所述初步扩充图像组成第三数据集；/n步骤4、利用预先创建的基于深度神经网络的生成式对抗网络模型的生成器生成对应于所述感兴趣区域图像的进一步扩充图像，所述进一步扩充图像组成第四数据集；/n步骤5、利用所述第二数据集中的一部分感兴趣区域图像训练目标分类器模型；/n步骤6、利用所述第二数据集中的另一部分感兴趣区域图像验证所述目标分类器模型的准确率并得到分类准确率值q1，利用所述第三数据集验证所述目标分类器模型的准确率并得到分类准确率值q2，利用所述第四数据集验证所述目标分类器模型的准确率并得到分类准确率值q3，q2与q1之差的绝对值和q3与q1之差的绝对值均小于预设阈值；以及/n步骤7、将所述第二数据集、所述第...

【技术特征摘要】
1.一种基于深度学习的分类器模型的训练方法，其特征在于，包括以下步骤：
步骤1、根据预设分类标准对原始医学图像进行人工分类并添加分类标签，带有所述分类标签的所述原始医学图像组成第一数据集；
步骤2、从所述第一数据集中的所述原始医学图像中获取感兴趣区域图像，所述感兴趣区域图像组成第二数据集；
步骤3、对所述第二数据集中的所述感兴趣区域图像执行翻转、旋转、缩放操作以得到初步扩充图像，所述初步扩充图像组成第三数据集；
步骤4、利用预先创建的基于深度神经网络的生成式对抗网络模型的生成器生成对应于所述感兴趣区域图像的进一步扩充图像，所述进一步扩充图像组成第四数据集；
步骤5、利用所述第二数据集中的一部分感兴趣区域图像训练目标分类器模型；
步骤6、利用所述第二数据集中的另一部分感兴趣区域图像验证所述目标分类器模型的准确率并得到分类准确率值q1，利用所述第三数据集验证所述目标分类器模型的准确率并得到分类准确率值q2，利用所述第四数据集验证所述目标分类器模型的准确率并得到分类准确率值q3，q2与q1之差的绝对值和q3与q1之差的绝对值均小于预设阈值；以及
步骤7、将所述第二数据集、所述第三数据集以及所述第四数据集输入到所述目标分类器模型重新进行训练并得出分类准确率值q4，q4分别大于q1、q2或q3，
其中，所述第二数据集、所述第三数据集以及所述第四数据集的数据量相等。

2.根据权利要求1所述的基于深度学习的分类器模型的训练方法，其特征在于，所述生成式对抗网络模型的训练过程为：基于所述第二数据集和预设随机分布噪声对所述生成式对抗网络模型的生成器和判别器进行交替训练。

<...

【专利技术属性】
技术研发人员：谭海宁，沈建雄，戎天华，冯尔维，
申请(专利权)人：中国医学科学院北京协和医院，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人