【技术实现步骤摘要】
一种具有循环性质的特征插值的不平衡数据图像生成方法
[0001]本专利技术属于计算机视觉和人工智能
,具体涉及一种具有循环性质的特征插值的不平衡数据图像生成方法。
技术介绍
[0002]随着人工智能技术的发展,深度学习模型在学术界和工业界获得了广泛的应用。不过现有的许多研究表明,深度学习模型面临着类别不平衡的挑战。更具体的说,庞大的训练数据往往呈现出不平衡或长尾的标签分布,这使得模型更关注样本数量多的类别,而忽略样本数量少的类别。
[0003]为了缓解类别不平衡问题,跟踪最近的研究,可以简单分为算法级和数据级的方法。算法级方法的思想是通过一些代价敏感的策略来促使模型关注少数类别;数据级的方法则是通过增加少数类样本或减少多数类样本来平衡数据集。近年来,生成对抗网络被用于生成具有高视觉保真度的图像,研究人员已经证明这些图像可以用作额外的训练数据来改善分类或其他应用。遗憾的是,在不平衡的数据集上,常规的图像生成方法往往失效,更具体地说,图像生成模型很难保证增强样本的可靠性和多样性。因此,在广泛存在的不平衡现象下设计一 ...
【技术保护点】
【技术特征摘要】
1.一种具有循环性质的特征插值的不平衡数据图像生成方法,其特征在于,包括以下步骤:(1)对预先获取的平衡数据集进行人工不平衡处理,选择部分类别作为少数类别,并划分为训练集和测试集;(2)搭建基于特征插值的图像生成网络模型,以全卷积的自编码器网络为骨干网络,复用编码器结构形成特征级别的循环;(3)确定图像生成网络模型的损失函数,并在训练集上对图像生成网络模型进行训练;(4)利用训练好的图像生成网络模型对训练集的少数类别进行过采样平衡数据集;(5)使用统一基准分类器验证提出的图像生成方法对不平衡数据集的改善。2.根据权利要求1所述的一种具有循环性质的特征插值的不平衡数据图像生成方法,其特征在于,所述步骤(1)实现过程如下:随机抽取数据集中的一半类别作为少数类,将选中类别样本数量降采样到20和150两种规格。3.根据权利要求1所述的一种具有循环性质的特征插值的不平衡数据图像生成方法,其特征在于,步骤(2)所述自编码器网络的前半部分为编码器网络,利用4
×
4的卷积核大小,步长为4进行特征降维,每一次卷积操作之后均经过批归一化和Leaky Relu激活函数;后半部分为解码器网络,利用是4
×
4的反卷积模块,步长为4,每一次卷积操作后经过批归一化和Relu激活函数,最后一层激活函数为tanh,将压缩的高级特征还原为原始图像。4.根据权利要求1所述的一种具有循环性质的特征插值的不平衡数据图像生成方法,其特征在于,步骤(3)所述图像生成网络模型的损失函数为:通过均...
【专利技术属性】
技术研发人员:邵长斌,吴仕祺,苏贞,李文杰,于化龙,
申请(专利权)人:江苏科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。