图像增强方法、真伪商品鉴别方法及设备技术

技术编号:28204761 阅读:20 留言:0更新日期:2021-04-24 14:31
本发明专利技术涉及一种图像增强方法、真伪商品鉴别方法及设备。本发明专利技术的目的是提供一种图像增强方法、真伪商品鉴别方法及设备,以避免数据集有偏导致分类模型过拟合到无关因子。本发明专利技术的技术方案是:一种图像增强方法,其特征在于:S01、对于具体的图像分类任务分析其中分类无关的有偏因子,控制有偏因子对应的属性为唯一变量,摄取图像作为源域数据集;S02、通过GAN网络结构训练有偏因子对应属性迁移模型,学习一个生成器G,x

【技术实现步骤摘要】
图像增强方法、真伪商品鉴别方法及设备


[0001]本专利技术涉及一种图像增强方法、真伪商品鉴别方法及设备。适用于计算机视觉领域。

技术介绍

[0002]当前大多数的赝品商品检测方案都是主动式,这类技术一般是在商品制造过程中,在原始商品上嵌入额外的内容,比如条形码、防伪油墨、防伪标签等等。这类技术往往成本昂贵,并且防伪作用有限。
[0003]目前,在深度学习之父LeCun的支持下,Entrupy公司提出一种基于图像进行包包真假鉴定的方法,然而该方法需要配备专用的显微镜头来拍摄图像,并且需要在特定外界光照条件下采集数以百万计的图像来训练模型,这些条件限制了他们的方法在日常应用中的可行性。
[0004]在当前海量带标签数据集(比如图像分类数据集Imagenet)的支持下,深度学习在图像分类领域取得了巨大突破,然而对海量样本的依赖也限制了深度学习技术在有限样本数据集分类任务上的进一步突破,于是数据增强技术被提出以提升有限样本数据的利用率。传统的数据增强方法主要包括旋转、平移、随机颜色、Mixup等手段来扩增样本,可以在一定程度上对模型进行正则,减小过拟合风险。
[0005]现有主流的深度分类模型的性能都依赖于海量无偏的训练数据,当现实场景无法提供大量无偏的训练样本时,深度学习容易过拟合到分类无关的有偏属性上,而现有的数据增强技术并不能解决由于数据集有偏导致模型过拟合的问题。

技术实现思路

[0006]本专利技术要解决的技术问题是:针对上述存在的问题,提供一种图像增强方法、真伪商品鉴别方法及设备,以避免数据集有偏导致分类模型过拟合到无关因子。
[0007]本专利技术所采用的技术方案是:一种图像增强方法,其特征在于:
[0008]S01、对于具体的图像分类任务分析其中分类无关的有偏因子,控制有偏因子对应的属性为唯一变量,摄取图像作为源域数据集;
[0009]S02、通过GAN网络结构训练有偏因子对应属性迁移模型,学习一个生成器G,x

=G(x,a);
[0010]其中x表示输入图像,取至源域数据集;a表示目标属性,为有偏因子对应属性;x

表示生成的图像,图像x

和x有相同的语义内容,x

的属性风格由a指定;
[0011]生成器G在训练过程中,约束生成图像x

真实,约束生成图像x

具有a指定的属性;
[0012]S03、在目标数据集上,应用经训练的生成器G扩充样本,对于目标数据集上的每一个样本,通过遍历有偏因子对应属性所有的取值a,得到无偏的生成样本。
[0013]步骤S02包括:
[0014]计算图像x和x

之间的细节保持得分s;
[0015]在生成器G在训练过程中约束生成图像x

保持x中的高频细节成分。
[0016]采用细节保持模块计算图像x和x

之间的细节保持得分s;
[0017]所述细节保持模块包含一个不可学习的卷积层,卷积核为laplacian滤波核,Laplacian核对x和x

滤波之后得到对应的高频分量,统计高频分量的距离计算得到s。
[0018]一种存储介质,其上存储有可被处理器执行的计算机程序,其特征在于:所述计算机程序被执行时实现所述图像增强方法的步骤。
[0019]一种真伪商品鉴别方法,其特征在于:具有通过所述图像增强方法得到的无偏生成样本训练而成的分类器。
[0020]一种存储介质,其上存储有可被处理器执行的计算机程序,其特征在于:所述计算机程序被执行时实现所述真伪商品鉴别方法的步骤。
[0021]一种真伪商品鉴别设备,具有处理器和存储器,存储器上存储有可被处理器执行的计算机程序,其特征在于:所述计算机程序被执行时实现所述真伪商品鉴别方法的步骤。
[0022]还具有用于摄取待鉴别商品图像的摄像模块。
[0023]本专利技术的有益效果是:本专利技术基于图像生成技术对数据集中有偏的属性进行均匀无偏的样本生成,从而得到相对无偏的增强数据集,利用该增强数据集训练的模型能避免过拟合到有偏属性。
[0024]本专利技术通过局部细节保持模块比较生成器生成的图像和原始图像之间的、对于真假商品的鉴定更加重要微观细节,以确保生成的图像和原始图像的细节成分具有一定的相似度。
附图说明
[0025]图1为实施例的框图。
[0026]图2为实施例中的测试结果对比图。
[0027]图3为实施例中不同规模的训练数据集条件下的测试结果对比图。
具体实施方式
[0028]本实施例为一种真伪商品鉴别方法,具有用于商品真伪分类的分类器,该分类器经海量样本训练而成,海量样本通过基于生成对抗网络的真伪商品图像增强方法生成。
[0029]本例中基于生成对抗网络的真伪商品图像增强方法的具体步骤如下:
[0030]S01、对于具体的分类任务分析其中分类无关的有偏因子(无关因子),控制控制无关因子对应的属性为唯一变量,拍摄图像作为源域数据集。
[0031]本实施例以LV棋盘格真假包包分类为例进行分析,光照条件是分类无关的无关因子,控制光照为唯一变量,拍摄图像作为源域数据集。
[0032]S02、通过GAN网络结构训练有偏因子对应属性迁移模型,学习一个生成器G,x

=G(x,a);
[0033]其中x表示输入图像,取至源域数据集;a表示目标属性,无关属性的取值标签(光照条件1、光照条件2

);x

表示生成的图像,图像x

和x有相同的语义内容,x

的属性风格由a指定。
[0034]通过细节保持模块s=E(x,x

)计算这两幅图像之间的细节保持得分,如果两个图
像的细节成分越相似,这个得分越小。
[0035]细节保持模块包含一个不可学习的卷积层,卷积核为laplacian滤波核,Laplacian核对x和x

滤波之后得到对应的高频分量,直接统计高频分量的距离计算得到s。
[0036]生成器G在训练过程中,需要优化3个loss:1)约束生成图像x

真实;2)约束生成图像x

具有a指定的属性;3)约束生成图像x

保持x中的高频细节成分。
[0037]S03、在目标数据集(LV棋盘格真假分类)上,应用步骤S02训练的生成器G扩充更多的样本,对于目标数据集上的每一个样本,通过遍历无关属性所有的取值a,得到用于训练分类器的、无偏的生成样本。
[0038]本实施例提出了一种针对有限有偏数据集的无偏数据增强算法(CGUDA),并在LV棋盘格真假包包识别数据集上进行了测试,同时与目前深度学习中主流的数据增强方法进行比较,结果如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像增强方法,其特征在于:S01、对于具体的图像分类任务分析其中分类无关的有偏因子,控制有偏因子对应的属性为唯一变量,摄取图像作为源域数据集;S02、通过GAN网络结构训练有偏因子对应属性迁移模型,学习一个生成器G,x

=G(x,a);其中x表示输入图像,取至源域数据集;a表示目标属性,为有偏因子对应属性;x

表示生成的图像,图像x

和x有相同的语义内容,x

的属性风格由a指定;生成器G在训练过程中,约束生成图像x

真实,约束生成图像x

具有a指定的属性;S03、在目标数据集上,应用经训练的生成器G扩充样本,对于目标数据集上的每一个样本,通过遍历有偏因子对应属性所有的取值a,得到无偏的生成样本。2.根据权利要求1所述的图像增强方法,其特征在于,步骤S02包括:计算图像x和x

之间的细节保持得分s;在生成器G在训练过程中约束生成图像x

保持x中的高频...

【专利技术属性】
技术研发人员:曹娟高科李蕾夏博洋谢添
申请(专利权)人:杭州中科睿鉴科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1