基于超小样本训练高效质检模型的方法及系统技术方案

技术编号:20021071 阅读:45 留言:0更新日期:2019-01-06 02:06
本发明专利技术提供了一种基于超小样本训练高效质检模型的方法,包括:确定采集种类,采集小样品,小样品模拟扩充;随机抽样打乱排序;Squeezenet Pro训练质检模型;测试模型结果;发布完成模型。本发明专利技术保证在样本数非常少的情况下,达到几十万样本数训练的深度学习模型的效果,从而更好的应用于工业质量检测中。

【技术实现步骤摘要】
基于超小样本训练高效质检模型的方法及系统
本专利技术属于质量检测领域,特别是涉及到一种基于超小样本训练高效质检模型的方法及系统。
技术介绍
传统的视觉算法在检测微小瑕疵(瑕疵大小约总大小的百分之一)的情况下,对光源相机的要求很苛刻,且针对表面凹凸不平,颜色多变的产品需要写大量的识别算法策略以满足检测需求,这大大降低了质量检测项目的开发效率。由于互联网渗透到社会各个领域的节奏加快,传统行业的改革和创新势在必行,不断地运用新技术,充分利用互联网技术,如大数据分析,人工智能算法从而达到快捷、准确、便利的产品质量检测,提供庞大的数据检测分析资料,准确找到多类型产品质量的多类型缺陷,不断升级产品质量的检测水平,提质增效,是目前发展的趋势。但在工业生产中,因为瑕疵品的样本数本身较少,且准备大量瑕疵品与正常样品需要耗费大量人力,因此提供大样本用于大数据分析、人工智能算法的训练几乎不可能,同样这项条件也限制了大数据分析、人工智能算法在工业应用中的推广。
技术实现思路
有鉴于此,本专利技术提供一种基于超小样本训练高效质检模型的方法及系统,保证在样本数非常少(十几个样本)的情况下,达到几十万样本数训练的深度学习模型的效果,从而更好的应用于工业质量检测中。为达到上述目的,本专利技术的技术方案是这样实现的:一种基于超小样本训练高效质检模型的方法,包括:步骤一、确定采集种类,包括要检测的瑕疵品种类和正常品种类,按照瑕疵大小占总样品大小的百分比分为N个等级,采集小样品;步骤二、各种类、各等级的小样品模拟扩充;步骤三、随机抽样组成训练集、验证集合、测试集;对每个集合打乱排序;步骤四、SqueezenetPro训练质检模型;步骤五、测试模型结果;根据精度和测试次数控制下一步跳转;步骤六、发布完成模型,根据步骤五得到的每一瑕疵级别的测试结果给出每一级瑕疵的识别精度,并且保存冻结每一级SqueezenetPro的权重,发布对应的SqueezenetPro模型。进一步的,步骤一的具体内容包括:1.1、确定要检测的瑕疵品种类为K-1次,K>=2,总类别为瑕疵品种类数+正常品种类=K类,每类样品搜集Mk,k=1,2,...,K个小样品,总共搜集个样品,其中Mk∈[5,10];1.2、将每类瑕疵品按照瑕疵大小占总样品大小的百分比分为N个等级,其中1.3、将每类样品分为两组:和其中为中随机抽取的80%的样品作为训练集合;为中随机抽取的20%的样品作为测试集合。进一步的,步骤二的具体内容包括:2.1.手动模拟样品;将第n个等级(n越大识别难度越高)的第k类瑕疵品和最后一类正常品k=1,2,...,K通过人工制造的方式扩充至原样品数的α1=5倍,即此时瑕疵品总数A=α1M=5M;2.2.连续拍照模拟;将手动模拟后的第n个等级的第k类瑕疵品和最后一类正常品通过统一样本在同一光源Light0、和相机Camera0条件下,以不同角度Anglep、方向Directionp、位置Positionp连续拍照的方式扩充样本数至原来的α2=500倍,其中Anglep∈ANGLE,p=1,2,...,P,ANGLE是实际生产线上产品可能出现的角度集合;Directionp∈DIRECTION,p=1,2,...,P,DIRECTION是实际生产线上产品可能出现的方向集合;Positionp∈POSITION,p=1,2,...,P,POSITION是实际生产线上产品可能出现的位置集合;通过该项模拟,有样本数将每类样品分为两组:训练集合和测试集合对每一个b0∈B0样本,通过相机Camera0进行拍照,使得每个b0样本扩充该步骤通过每次拍摄时相机感光的细微差异产生的噪声进行数据扩充,通过连续拍照模拟后得到的样本数为得到训练集合和测试集合2.3.自动模拟样本;图像增强算法模拟β0倍的好样品,将图像进行旋转、平移、裁剪、填充、亮度、对比度、色差操作,在不影响产品外观结构和产生瑕疵的情况下将好样品进行样本数扩充,即采用瑕疵品模拟算法对瑕疵品进行β0倍的扩充,对每一类瑕疵品k=1,2,...,K-1,生成该类瑕疵品的图像库主要由瑕疵品图像中的瑕疵图像部分的截取、互联网上搜索类似瑕疵部分的图像、和基于二维高斯分布的瑕疵图像模拟,其中基于二维高斯分布的瑕疵图像模拟采用如下公式w,h∈[-2γn,2γn],μ1,μ2∈[-γn,γn],ρ∈(-1,1),σ1,σ2∈(0,2γn],其中γn随着n的增大而减小,表示模拟的瑕疵变小,识别的难度逐步上升;对给定瑕疵类型k和给定瑕疵等级n,随机选择从中随机选择产品图像及随机选择坐标(w0,h0),将图像放置于的(w0,h0)处模拟生成新的瑕疵品,重复此过程β0次,得到将所有k=1,2,...,K输入生成对抗网络DCGAN模型中,重新生成扩充产生新样本获取到产品的三维模型,并在三维模型上基于随机选择坐标(w1,h1)贴图至产品三维模型中,并在三维模型中加入光源Light0、和相机Camera0以不同角度Anglep、方向Directionp、位置(Positionp进行模拟拍照,重复此过程次,得到汇总所有生成的新数据,得到其中α3=β0+β1+β2,j=0,1,2;从而得到训练集合和测试集合进一步的,步骤四的主要内容包括:4.1SqueezenetPro模型权重拷贝:初始化时将从Conv1层至Conv10层的所有权重WI,I=1,2,...,10由SqueezenetV1.1模型权重WI(0)所替换;如果已经存在了SqueezenetPro的训练模型,则所有权重WI由最新的SqueezenetPro的权重替换;4.2SqueezenetPro模型权重替换:将最顶层的softmax层的隐藏神经元σ替换为K个,即4.3开放SqueezenetPro的Wi提供训练,初始化训练次数tn=0,j初始值为10,输入数据,采用AdamGradient优化算法训练W10,并观察学习曲线,当Dvalid上的测试结果达到Plateau,标注le为训练精度,其中e为训练周期epoch,标注∈为训练结果最小差异标注E为训练周期的最小上线,当训练精度差异时,停止训练,判断le1是否大于0.99,如果是,则跳转至4.4;如果不是则设置i=i-1,开放SqueezenetPro的Wi权重提供训练,跳转至4.3重新训练;4.4判断当前训练次数trainn<Q是否成立,其中Q为在第n级瑕疵下的总训练次数;如果trainn<Q,则trainn=trainn+1,跳转至步骤三进行数据的重新筛选训练;如果trainn>Q,则跳转至步骤五。进一步的,步骤五的主要内容包括:将步骤三的测试集使用最新训练好的SqueezenetPro模型进行测试,如果精度大于等于0.99,则n=n+1增加瑕疵识别难度,并跳转至步骤二进行小样本的模拟和训练;如果精度小于0.99,则判断当前测试次数testn<O是否成立,其中O为在第n级瑕疵下的总测试次数;如果testn<O,则testn=testn+1,跳转至步骤二进行小样本的模拟和训练,如果testn>O,则跳转至步骤六。本专利技术的另一方面,还提供了一种基于超小样本训练高效质检模型的系统,包括:采集模块:确定采集种类,包括要检测的瑕疵品种类和正常品种类,按照瑕疵本文档来自技高网...

【技术保护点】
1.一种基于超小样本训练高效质检模型的方法,其特征在于,包括:步骤一、确定采集种类,包括要检测的瑕疵品种类和正常品种类,按照瑕疵大小占总样品大小的百分比分为N个等级,采集小样品;步骤二、各种类、各等级的小样品模拟扩充;步骤三、随机抽样组成训练集、验证集合、测试集;对每个集合打乱排序;步骤四、Squeezenet Pro训练质检模型;步骤五、测试模型结果;根据精度和测试次数控制下一步跳转;步骤六、发布完成模型,根据步骤五得到的每一瑕疵级别的测试结果给出每一级瑕疵的识别精度,并且保存冻结每一级Squeezenet Pro的权重,发布对应的Squeezenet Pro模型。

【技术特征摘要】
1.一种基于超小样本训练高效质检模型的方法,其特征在于,包括:步骤一、确定采集种类,包括要检测的瑕疵品种类和正常品种类,按照瑕疵大小占总样品大小的百分比分为N个等级,采集小样品;步骤二、各种类、各等级的小样品模拟扩充;步骤三、随机抽样组成训练集、验证集合、测试集;对每个集合打乱排序;步骤四、SqueezenetPro训练质检模型;步骤五、测试模型结果;根据精度和测试次数控制下一步跳转;步骤六、发布完成模型,根据步骤五得到的每一瑕疵级别的测试结果给出每一级瑕疵的识别精度,并且保存冻结每一级SqueezenetPro的权重,发布对应的SqueezenetPro模型。2.根据权利要求1所述的方法,其特征在于,步骤一的具体内容包括:1.1、确定要检测的瑕疵品种类为K-1次,K>=2,总类别为瑕疵品种类数+正常品种类=K类,每类样品搜集Mk,k=1,2,...,K个小样品,总共搜集个样品,其中Mk∈[5,10];1.2、将每类瑕疵品按照瑕疵大小占总样品大小的百分比分为N个等级,其中1.3、将每类样品分为两组:和其中为中随机抽取的80%的样品作为训练集合;为中随机抽取的20%的样品作为测试集合。3.根据权利要求1所述的方法,其特征在于,步骤二的具体内容包括:2.1.手动模拟样品;将第n个等级(n越大识别难度越高)的第k类瑕疵品和最后一类正常品通过人工制造的方式扩充至原样品数的α1=5倍,即此时瑕疵品总数A=α1M=5M;2.2.连续拍照模拟;将手动模拟后的第n个等级的第k类瑕疵品和最后一类正常品通过统一样本在同一光源Light0、和相机Camera0条件下,以不同角度Anglep、方向Directionp、位置Positionp连续拍照的方式扩充样本数至原来的α2=500倍,其中Anglep∈ANGLE,p=1,2,...,P,ANGLE是实际生产线上产品可能出现的角度集合;Directionp∈DIRECTION,p=1,2,...,P,DIRECTION是实际生产线上产品可能出现的方向集合;Positionp∈POSITION,p=1,2,...,P,POSITION是实际生产线上产品可能出现的位置集合;通过该项模拟,有样本数将每类样品分为两组:训练集合和测试集合对每一个b0∈B0样本,通过相机Camera0进行拍照,使得每个b0样本扩充该步骤通过每次拍摄时相机感光的细微差异产生的噪声进行数据扩充,通过连续拍照模拟后得到的样本数为得到训练集合和测试集合2.3.自动模拟样本;图像增强算法模拟β0倍的好样品,将图像进行旋转、平移、裁剪、填充、亮度、对比度、色差操作,在不影响产品外观结构和产生瑕疵的情况下将好样品进行样本数扩充,即采用瑕疵品模拟算法对瑕疵品进行β0倍的扩充,对每一类瑕疵品生成该类瑕疵品的图像库主要由瑕疵品图像中的瑕疵图像部分的截取、互联网上搜索类似瑕疵部分的图像、和基于二维高斯分布的瑕疵图像模拟,其中基于二维高斯分布的瑕疵图像模拟采用如下公式其中γn随着n的增大而减小,表示模拟的瑕疵变小,识别的难度逐步上升;对给定瑕疵类型k和给定瑕疵等级n,随机选择从中随机选择产品图像及随机选择坐标(w0,h0),将图像放置于的(w0,h0)处模拟生成新的瑕疵品,重复此过程β0次,得到将所有输入生成对抗网络DCGAN模型中,重新生成扩充产生新样本获取到产品的三维模型,并在三维模型上基于随机选择坐标(w1,h1)贴图至产品三维模型中,并在三维模型中加入光源Light0、和相机Camera0以不同角度Anglep、方向Directionp、位置(Positionp进行模拟拍照,重复此过程次,得到汇总所有生成的新数据,得到其中从而得到训练集合和测试集合4.根据权利要求1所述的方法,其特征在于,步骤四的主要内容包括:4.1SqueezenetPro模型权重拷贝:初始化时将从Conv1层至Conv10层的所有权重WI,I=1,2,...,10由SqueezenetV1.1模型权重WI(0)所替换;如果已经存在了SqueezenetPro的训练模型,则所有权重WI由最新的SqueezenetPro的权重替换;4.2SqueezenetPro模型权重替换:将最顶层的softmax层的隐藏神经元σ替换为K个,即4.3开放SqueezenetPro的Wi提供训练,初始化训练次数tn=0,j初始值为10,输入数据,采用AdamGradient优化算法训练W10,并观察学习曲线,当Dvalid上的测试结果达到Plateau,标注le为训练精度,其中e为训练周期epoch,标注∈为训练结果最小差异标注E为训练周期的最小上线,当训练精度差异时,停止训练,判断le1是否大于0.99,如果是,则跳转至4.4;如果不是则设置i=i-1,开放SqueezenetPro的Wi权重提供训练,跳转至4.3重新训练;4.4判断当前训练次数trainn<Q是否成立,其中Q为在第n级瑕疵下的总训练次数;如果trainn<Q,则trainn=trainn+1,跳转至步骤三进行数据的重新筛选训练;如果trainn>Q,则跳转至步骤五。5.根据权利要求1所述的方法,其特征在于,步骤五的主要内容包括:将步骤三的测试集使用最新训练好的SqueezenetPro模型进行测试,如果精度大于等于0.99,则n=n+1增加瑕疵识别难度,并跳转至步骤二进行小样本的模拟和训练;如果精度小于0.99,则判断当前测试次数testn<O是否成立,其中O为在第n级瑕疵下的总测试次数;如果testn<O,则testn=testn+1,跳转至步骤二进行小样本的模拟和训练,如果testn>O,则跳转至步骤六。6.一种基于超小样本训练高...

【专利技术属性】
技术研发人员:罗晓忠毛子靖
申请(专利权)人:广州市心鉴智控科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1