一种用于工业大数据处理的训练样本生成方法技术

技术编号:20797729 阅读:26 留言:0更新日期:2019-04-06 11:20
本发明专利技术属于图像处理领域,并具体公开了一种用于工业大数据处理的训练样本生成方法,包括:构建各类工业图像数据集,并根据各类工业图像数据集中的数据量划分出大样本数据集与小样本数据集;构建工业图像生成对抗网络及优化目标函数,基于优化目标函数对工业图像生成对抗网络进行迭代训练获得小样本生成参数模型;将大样本数据集中的大样本图像输入训练获得的小样本生成参数模型中以生成小样本图像,以此完成训练样本的生成。本发明专利技术无需对工业图像进行复杂的数字图像处理操作,也无需对原始工业图像进行各种变换,可以避免过多的人工干预,减少操作人员专业素养造成的工业图像生成的误差。

A Training Sample Generation Method for Industrial Large Data Processing

The invention belongs to the field of image processing, and specifically discloses a training sample generation method for industrial large data processing, including: constructing various industrial image data sets, dividing large sample data sets and small sample data sets according to the data volume of various industrial image data sets, constructing industrial image generation antagonism network and optimizing objective function, based on optimizing objective function. Iterative training of industrial image generation antagonism network is carried out to obtain small sample generation parameter model, and input large sample image from large sample data set into the training small sample generation parameter model to generate small sample image, so as to complete the training sample generation. The invention does not need to perform complex digital image processing operations on industrial images, nor does it need to perform various transformations on the original industrial images, so as to avoid excessive manual interference and reduce the error of industrial image generation caused by the professional accomplishment of operators.

【技术实现步骤摘要】
一种用于工业大数据处理的训练样本生成方法
本专利技术属于图像处理领域,更具体地,涉及一种用于工业大数据处理的训练样本生成方法。
技术介绍
随着智能制造的提出,工业大数据技术成为未来提高制造业生产力、竞争力、创新力的关键因素,但作为驱动工业大数据技术的原始动力,工业数据尤其是工业图像数据仍然存在众多问题:1)样本不平衡问题,即工业图像数据各类之间存在数据量差距过大;2)可获取工业图像数据多样性不足,不能覆盖工业数据现有的数据特征。这使得使用工业数据训练的模型泛化能力低且鲁棒性很差。以上缺点严重制约工业大数据模型的性能提升。因此,需要一种工业图像训练样本的生成方法以提高数据的数量与多样性。目前已有的工业图像生成方法主要为两种思路:1)对原始图像数据进行翻转、旋转、随机裁剪、局部变形等变换以扩充原始数据,该方法只能增加图像数据的数量,不能增加图像数据特征的多样性;2)利用数字图像处理技术以及CAD技术模拟工业图像数据,该方法只能对形态较为简单的工业图像进行建模并且生成的工业图像与真实缺陷图像存在一定的差异。因此,传统的工业图像生成方法已经不能满足需求,研究设计一种新的工业图像生成方法成为本本文档来自技高网...

【技术保护点】
1.一种用于工业大数据处理的训练样本生成方法,其特征在于,包括如下步骤:1)构建各类工业图像数据集,并根据各类工业图像数据集中的数据量划分出大样本数据集与小样本数据集;2)构建工业图像生成对抗网络cycleD2GAN,包括两个工业图像生成器和四个工业图像鉴别器,分别为小样本图像生成器G、大样本图像生成器F、小样本图像鉴别器D1s、小样本图像鉴别器D2s、大样本图像鉴别器D1b和大样本图像鉴别器D2b;3)构建工业图像生成对抗网络的优化目标函数,并基于优化目标函数分别对两个图像生成器和四个图像鉴别器进行迭代训练,以训练获得小样本生成参数模型,其中小样本图像生成器G的训练与小样本图像鉴别器D1s和...

【技术特征摘要】
1.一种用于工业大数据处理的训练样本生成方法,其特征在于,包括如下步骤:1)构建各类工业图像数据集,并根据各类工业图像数据集中的数据量划分出大样本数据集与小样本数据集;2)构建工业图像生成对抗网络cycleD2GAN,包括两个工业图像生成器和四个工业图像鉴别器,分别为小样本图像生成器G、大样本图像生成器F、小样本图像鉴别器D1s、小样本图像鉴别器D2s、大样本图像鉴别器D1b和大样本图像鉴别器D2b;3)构建工业图像生成对抗网络的优化目标函数,并基于优化目标函数分别对两个图像生成器和四个图像鉴别器进行迭代训练,以训练获得小样本生成参数模型,其中小样本图像生成器G的训练与小样本图像鉴别器D1s和D2s的训练为一组对抗过程,大样本图像生成器F的训练与大样本图像鉴别器D1b和D2b的训练为一组对抗过程;4)将步骤1)中大样本数据集中的大样本图像输入训练获得的小样本生成参数模型中以生成小样本图像,以此完成训练样本的生成。2.如权利要求1所述的用于工业大数据处理的训练样本生成方法,其特征在于,步骤2)构建工业图像生成对抗网络cycleD2GAN,具体包括以下子步骤:2.1)构建小样本图像生成器G,其网络结构包括输入层、学习层和输出层,其中学习层包括多个卷积+降采样层、若干个转换层、以及若干个卷积+上采样层,其输入为大样本图像,输出为生成的小样本图像;2.2)构建大样本图像生成器F,其网络结构与小样本图像生成器G的网络结构相同,其输入为小样本图像,输出为生成的大样本图像;2.3)构建小样本图像鉴别器D1s,其用于鉴别输入的小样本图像是生成的小样本图像还是真实的小样本图像,其网络结构包括输入层、学习层和输出层,其中学习层包括若干个卷积+降采样层、以及若干个全连接层,当输入为真实的小样本图像时输出为1,当输入为生成的小样本图像时输出为0;2.4)构建小样本图像鉴别器D2s,其作用及网络结构与小样本图像鉴别器D1b相同,当输入为真实的小样本图像时输出为0,当输入为生成的小样本图像时输出为1;2.5)构建大样本图像鉴别器D1b,其用于鉴别输入的大样本图像为生成的大样本图像还是真实的大样本图像,其网络结构与小样本图像鉴别器D1b相同,当输入为真实的大样本图像时输出为1,当输入为生成的大样本图像时输出为0;2.6)构建大样本图像鉴别器D2b,其作用及网络结构与大样本图像鉴别器D1b相同,当输入为真实的大样本图像时输出为0,当输入为生成的大样本图像时输出为1。3.如权利要求1所述的用于工业大数据处理的训练样本生成方法,其特征在于,步骤3)中构建的工业图像生成对抗网络的优化目标函数包括生成器G与鉴别器D1s和D2s的对抗损失Lgan(G;D1s;D2s;b;s)、生成器F与鉴别器D1b和D2b的对抗损失Lgan(F;D1b;D2b;s;b)、以及循环一致损失Lcyc(G,F)。4.如权利要求3所述的用于工业大数据处理的训练样本生成方法,其特征在于,步骤3)中基于优化...

【专利技术属性】
技术研发人员:李斌牛拴龙唐立新林惠邱园红李言洲牛通之王博郝雪桐李西凯魏富春
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1