【技术实现步骤摘要】
一种面向传染病图像的数据增强方法及其系统
[0001]本专利技术属于图像数据处理
,具体涉及一种面向传染病图像数据增强方法及系统。
技术介绍
[0002]在传染病的发展初期,由于数据集不够充足,采用深度学习方法进行监测通常会由于过拟合导致准确度不够,同时以往的深度学习方法是找到一个最适合的模型同时对模型的参数进行设置,来达到一个最佳模型的选择,这样做降低了监测的泛化性和鲁棒性。而解决这个问题的方法就是数据增强。
[0003]数据增强是为了减少网络的过拟合现象,通过对训练图片进行变换可以得到泛化能力更强的网络,更好的适应应用场景。可以分为有监督的数据增强和无监督的数据增强方法。其中有监督的数据增强又可以分为单样本数据增强和多样本数据增强。单样本数据增强包括几何变换、颜色变换等等。多样本数据增强不同于单样本数据增强,多样本数据增强利用了多个样本产生新的样本。无监督的数据增强方法包括两类:通过模型学习数据的分布,随机生成与训练数据集分布一致的图片,代表方法GAN;通过模型,学习出适合当前任务的数据增强方法,代表方法A ...
【技术保护点】
【技术特征摘要】
1.一种面向传染病图像的数据增强方法,其特征在于,包括:图像数据集分类得到预测集和训练集;通过数据增强方法对训练集进行处理;其中,所述数据增强方法定义为MergeMix方法,包括,对数据集中的每个样本进行单样本数据增强,随机选取样本进行多样本数据增强,汇总两种增强的结果。2.如权利要求1所述的面向传染病图像的数据增强方法,其特征在于:所述分类包括,图像数据集按传染病感染程度进行划分,再以4:1的比例均匀分为训练集和测试集,将图像数据和类别存为torch.utils.data.Dataset格式,表示为:list={image,class}其中,list是最终数据,image是图片,class表示来自不同的感染程度。3.如权利要求1所述的面向传染病图像的数据增强方法,其特征在于:所述单样本数据增强通过对多个处理策略进行随机选取及参数随机实现样本增强;多样本数据增强通过多个样本进行线性融合后再通过单样本数据增强方法进行增强。4.如权利要求1或3所述的面向传染病图像的数据增强方法,其特征在于:所述多个处理策略包括Randomcrop处理、Cutout处理、edgenoise处理、RandomRotation处理、RandomHorizontalFlip处理。5.如权利要求1或4所述的面向传染病图像的数据增强方法,其特征在于:包括,所述Randomcrop处理表示为:image=image.crop((x,y,x+new_w,y+new_h))其中,image表示图像,crop函数表示图像裁剪出来的区域,x,y分别表示横轴初始位置和纵轴初始位置,new_w,new_h表示新图片的宽高;所述Cutout处理表示为:image=image.paste((x,y,x+w,y+h))其中,image表示图像,paste函数表示图像填充出来的区域,x,y分别表示横轴初始位置和纵轴初始位置,w,h表示新图片填充区域的宽高;所述edgenoise处理表示为:image[x
left
,y,:]=0,image[x
right
,y,:]=0,image[x,y
up
,:]=0,image[x,y
down
,:]=0,image[x
left
,y,:]=255,image[x
right
,y,:]=255,image[x,y
up
,:]=255,image[x,y
down
,:]=255其中,image表示图像,x,y表示横轴、纵轴上的随机函数,x
left
,x
right
,y
up
,y
down
表示横轴、纵轴边缘上的随机函数;所述RandomRotation处理表示为:image=transform.RandomRotation(theta)(image)其中,image表示图像,transfo...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。