【技术实现步骤摘要】
一种新的图像数据扩充方法、系统、终端及存储介质
本专利技术属于机器视觉
,尤其涉及一种新的图像数据扩充方法、系统、终端及存储介质。
技术介绍
目前,深度卷积神经网络在图像识别中取得了巨大的成功。与传统的特征工程不同,深度卷积神经网络通过卷积层和池化层将图像降维到一维向量,因此不再需要相关专业知识来设计一系列特征。深度卷积神经网络需要大量的参数来拟合输入与输出之间的映射关系。由于参数的数量很大,因此需要大批量的带注释的图像数据对这些参数进行训练优化,否则会出现过拟合。在一些领域,例如药物发现、医学影像中,图像数据比较稀缺,同时数据的标注又必须由专业人员完成,因此很难在这些领域收集到带标注的大批量数据集。数据扩充是一种可以增加数据集样本量的技术。在深度神经网络的应用中,数据扩充常常用来增加训练集的样本量,可以很好的防止过拟合的出现。目前常用的数据扩充技术包括:翻转、裁剪、填充、旋转、加入噪声、高斯模糊、仿射变换、生成式对抗网络等。现有的这些数据扩充技术存在以下的问题和缺陷:1)引入了虚假信息、破坏了真实信息 ...
【技术保护点】
1.一种新的图像数据扩充方法,其特征在于,所述新的图像数据扩充方法包括:/n使用训练集组织方法和训练集图像拼接方法对原始图像训练集进行扩充,得到拼接图像训练集以及每张拼接图像所对应的拼接标签;/n利用拼接图像训练集以及拼接标签对图像分类器进行训练;/n使用测试集组织方法和测试集图像拼接方法对原始图像测试集进行拼接,得到拼接图像测试集;将拼接图像测试集输入到训练后的图像分类器中,得到每一张测试拼接图像在拼接标签上的概率分布,再利用标签映射函数将拼接标签的概率分布映射到原始标签的概率分布上。/n
【技术特征摘要】
1.一种新的图像数据扩充方法,其特征在于,所述新的图像数据扩充方法包括:
使用训练集组织方法和训练集图像拼接方法对原始图像训练集进行扩充,得到拼接图像训练集以及每张拼接图像所对应的拼接标签;
利用拼接图像训练集以及拼接标签对图像分类器进行训练;
使用测试集组织方法和测试集图像拼接方法对原始图像测试集进行拼接,得到拼接图像测试集;将拼接图像测试集输入到训练后的图像分类器中,得到每一张测试拼接图像在拼接标签上的概率分布,再利用标签映射函数将拼接标签的概率分布映射到原始标签的概率分布上。
2.如权利要求1所述的新的图像数据扩充方法,其特征在于,所述训练集组织方法包括:
在原始图像训练集中,随机的挑选多张属于同一类别的原始图像拼接在一起得到一张拼接图像,并为每一张拼接图像配置对应的拼接标签;所有的拼接图像一起就组成了拼接图像训练集;
m表示原始图像训练集中类别的数量,Ni(i=1,…,m)表示原始图像训练集中属于类别i的原始图像的数量,Li(i=1,…,m)表示类别i的标签,k表示得到一张拼接图像所需的原始图像的数量,表示标签的拼接;则原始图像训练集的样本量N表示为:
拼接标签表示为:
其中表示k张Li的图像拼接得到的拼接标签;
属于拼接标签的拼接图像的数量为:
则拼接图像训练集的样本量Ns为:
训练集的样本量从N扩充到了Ns;扩充的幅度由参数k控制。
3.如权利要求1所述的新的图像数据扩充方法,其特征在于,所述训练集图像拼接方法包括:
将多张原始图像在宽度方向上首尾相连,并在连接处添加一块间隔区域,间隔区域中所有的像素值都为0;
原始图像的宽度为w,高度为h,一张拼接图像所需的原始图像的数量为k,间隔区域的宽度为g,则拼接图像的宽度为kw+(k-1)g,高度为h。
4.如权利要求1所述的新的图像数据扩充方法,其特征在于,所述测试集组织方法包括:
在原始图像测试集中,将一张原始图像重复k次,然后拼接在一起得到对应的拼接图像;一张原始图像拼接得到一张拼接图像;所有的拼接图像组成拼接图像测试集;拼接图像测试集的样本量与原始图像测试集一致。
5.如权利要求1所述的新的图像数据扩充方法,其特征在于,所述测试集图像拼接方法包括:
将同一张原始图像重复k次,首尾相连,并在连接处添加一块间隔区域,间隔区域中所有的像素值都为0;得到的拼接图像的宽度和高度与拼接图像训练集中的拼接图像一致。
6.如权利要求1所述的新的图像数据扩充方法,其特征在于,所述使用标签映射函数将拼接图像测试集在拼接标签上的概率分布映射到原始标签上的方法包括:
表示拼接图像测试集中拼接图像在的概率分布,Pj(Li),(j=1,…,k;i=1,…,m)表示拼接图像中第j张原始图像在原始标签Li...
【专利技术属性】
技术研发人员:胡联亭,卢龙,
申请(专利权)人:苏州智乐康医疗科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。