一种AI神经网络模型的训练方法及相关装置制造方法及图纸

技术编号:32247296 阅读:20 留言:0更新日期:2022-02-09 17:50
本申请公开了一种AI神经网络模型的训练方法及相关装置,用于降低漏检率和误检率。本申请方法包括:获取训练样本集;建立初始AI神经网络模型;将训练样本输入初始AI神经网络模型;进行卷积特征提取,生成第一样本特征;对第一样本特征进行通道混合,生成第二样本特征;对第二样本特征进行池化降维处理和dropout操作,生成第三样本特征;对第三样本特征进行高维特征提取,生成第四样本特征;对第四样本特征进行卷积处理,生成第五样本特征;对第五样本特征进行分块池化降维处理,生成特征值向量;对特征值向量进行计算,生成概率分布;计算损失值,生成损失值变化数据;判断在预设区间内否小于预设阈值;若是,则确定训练完成。则确定训练完成。则确定训练完成。

【技术实现步骤摘要】
一种AI神经网络模型的训练方法及相关装置


[0001]本申请涉及神经网络领域,尤其涉及一种AI神经网络模型的训练方法及相关装置。

技术介绍

[0002]随着信息显示技术的不断发展,显示屏(Organic Electroluminescence Display,OLED)凭借其自发光、可弯曲、视角广泛、响应速度快、制程简单等优势,正逐步取代传统的LCD,快速深入的应用到现代社会的各个领域。
[0003]在OLED生产制作的过程中,由于OLED制程工艺复杂、蒸镀工艺难以实现非常良好的平整性,导致每个子像素的发光亮度在相同外部条件下差异较大,这是一种常见缺陷Mura,在OLED显示中相较半导体发光二极管(Light Emitting Diode、LCD)更为严重。这就使得在OLED制作完成之后,需要对每个OLED的子像素进行补偿,以达到显示屏显示标准。在对OLED的子像素进行补偿之前,首先需要对OLED进行良品检测,只有非良品的OLED才需要进行子像素进行补偿。当前OLED的良品检测在技术和方式有三类:机器视觉检测、影像亮度色度计、人工检测。
[0004]影像亮度色度计检测:影像亮度色度计检测是基于CCD的影像系统,经过校准之后,对光线、亮度和色彩的反应与CIE模型定义的标准大体一致,能近似获得人眼感知效果。优点是具有缺陷固定情况下重复检测效率高的优点,但是存在检测灵活性差,成本高,时延大等缺点。人工检测:当前人工检测方式,众所周知,人工检测存在主观性、随意性、效率低,成本高、误差大等缺点,由于缺陷Mura低对比度、边缘模糊、形状不固定等特性,导致人眼无法识别,所以人工检测已经是濒临淘汰的最原始检测方式。机器视觉检测:机器视觉检测包含图像预处理系统、判别系统、深度学习平台,图片存储系统,综合运用了图像预处理、缺陷检测算法、机器学习、深度学习等AI技术。先通过工业相机获取显示屏图像,再使用图像预处理技术凸显特征,通过训练好的卷积神经网络模型算法进行识别,从而达到代替人工检测的目的。具备效率高,成本低,灵活性强的优点。所以,机器视觉检测就成为了当前较为重点研究的良品检测方式。
[0005]当前,存在一种使用VGG

16卷积神经网络模型对OLED进行良品检测的方式。使用VGG

16卷积神经网络模型对OLED进行良品检测之前,需要将多组显示屏图像输入原始VGG

16卷积神经网络模型中进行网络的训练。但是,由于训练样本中的Mura缺陷类型各异,并且训练样本的尺寸大小不同,神经网络随着卷积层数的增加,小的Mura缺陷特征会被淹没在背景中,使得神经网络模型的训练效果下降,增加了神经网络模型的漏检率和误检率。

技术实现思路

[0006]本申请第一方面提供了一种AI神经网络模型的训练方法,其特征在于,包括:获取训练样本集,训练样本集中包含存在Mura缺陷的显示屏的拍摄图像和不存在Mura缺陷的显示屏的拍摄图像;
建立初始AI神经网络模型,初始AI神经网络模型中包含特征金字塔网络、通道混合模块、Trans模块、高维特征提取模块、Dense模块和空间通道金字塔池化模块,高维特征提取模块包含至少三个特征值向量提取层,特征值向量提取层由Trans子模块、Dense子模块和Xception子模块组成;从训练样本集中选取训练样本,输入初始AI神经网络模型;通过特征金字塔网络对训练样本进行卷积特征提取,生成第一样本特征,所述第一样本特征融合了不同深度卷积层的特征;通过通道混合模块对第一样本特征进行通道随机混合,生成第二样本特征;通过Trans模块对第二样本特征进行池化降维处理和dropout操作,生成第三样本特征,Trans模块包含空间金字塔通道池化层、全局平均池化层和dropout层;通过高维特征提取模块对第三样本特征进行高维特征提取,生成第四样本特征,Trans子模块包含空间金字塔通道池化层、全局平均池化层和dropout层,Dense子模块由至少两组BN层

Relu层

Conv层和Res残差网络组成;通过Dense模块对第四样本特征进行卷积处理,生成第五样本特征,Dense模块由至少两组BN层

Relu层

Conv层和Res残差网络组成,BN层

Relu层

Conv层中每一层的输出都作为下一个BN层

Relu层

Conv层的输入;通过空间通道金字塔池化模块对第五样本特征在H

W维度上进行分块池化降维处理,生成特征值向量,H和W分别代表训练样本的宽与高;对特征值向量进行计算,以生成训练样本归属良品和非良品的概率分布;根据训练样本归属良品和非良品的概率分布、训练样本归属良品和非良品的真实概率分布与初始AI神经网络模型的损失函数计算损失值,生成损失值变化数据,损失值变化数据为每一次训练生成的损失值的统计数据;判断损失值变化数据在预设区间内是否小于预设阈值;若损失值变化数据在预设区间内小于预设阈值,则确定初始AI神经网络模型为目标AI神经网络模型。
[0007]可选的,在判断损失值变化数据在预设区间内是否小于预设阈值之后,训练方法还包括:若损失值变化数据在预设区间内不小于预设阈值,则判断训练样本的训练次数是否达标;若训练样本的训练次数达标,根据小批梯度下降法更新初始AI神经网络模型的权值,并把训练过程中获取到的训练样本的特征和概率分布进行模型保存;从训练样本集中重新选取训练样本输入初始AI神经网络模型中训练。
[0008]可选的,在确定初始AI神经网络模型为目标AI神经网络模型之后,训练方法还包括:获取目标显示屏图像,并将目标显示屏图像输入目标AI神经网络模型,目标显示屏图像为目标显示屏的拍摄图像;将目标显示屏图像归属良品和非良品的概率分布中最大概率值输出;通过检测软件检测目标显示屏图像的归属良品和非良品的检测结果;根据最大概率值与检测结果输出目标显示屏的检测结果。
[0009]可选的,在判断训练样本的训练次数是否达标之后,训练方法还包括:若训练样本的训练次数未达标,则根据小批梯度下降法更新初始AI神经网络模型的权值,并将训练样本重新输入初始AI神经网络模型中训练。
[0010]可选的,通过特征金字塔网络对训练样本进行卷积特征提取,生成第一样本特征,包括:通过特征金字塔网络对训练样本依次进行多层次卷积处理、特征通道融合处理、通道降维处理、上采样处理、二次卷积采样处理和通道叠加处理,生成第一样本特征。
[0011]可选的,通过Trans模块对第二样本特征进行池化降维处理和dropout操作,生成第三样本特征,包括:通过Trans模块中的空间金字塔通道池化层对第二样本特征进行通道的分组,以使得每一组中包含不同份数的通道集合,每一个通道集合包含至少一个通道;对每一组中每一份通道集合的对应位置进行池化降维处理,并输出对应份数的通道池化数据,以生成初始通道池化数据集合;对只有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种AI神经网络模型的训练方法,其特征在于,包括:获取训练样本集,所述训练样本集中包含存在Mura缺陷的显示屏的拍摄图像和不存在Mura缺陷的显示屏的拍摄图像;建立初始AI神经网络模型,所述初始AI神经网络模型中包含特征金字塔网络、通道混合模块、Trans模块、高维特征提取模块、Dense模块和空间通道金字塔池化模块,所述高维特征提取模块包含至少三个特征值向量提取层,所述特征值向量提取层由Trans子模块、Dense子模块和Xception子模块组成;从所述训练样本集中选取训练样本,输入所述初始AI神经网络模型;通过特征金字塔网络对所述训练样本进行卷积特征提取,生成第一样本特征,所述第一样本特征融合了不同深度卷积层的特征;通过通道混合模块对所述第一样本特征进行通道随机混合,生成第二样本特征,所述;通过Trans模块对所述第二样本特征进行池化降维处理和dropout操作,生成第三样本特征,所述Trans模块包含空间金字塔通道池化层、全局平均池化层和dropout层;通过高维特征提取模块对所述第三样本特征进行高维特征提取,生成第四样本特征,所述Trans子模块包含空间金字塔通道池化层、全局平均池化层和dropout层,所述Dense子模块由至少两组BN层

Relu层

Conv层和Res残差网络组成;通过Dense模块对所述第四样本特征进行卷积处理,生成第五样本特征,所述Dense模块由至少两组BN层

Relu层

Conv层和Res残差网络组成,所述BN层

Relu层

Conv层中每一层的输出都作为下一个BN层

Relu层

Conv层的输入;通过所述空间通道金字塔池化模块对所述第五样本特征在H

W维度上进行分块池化降维处理,生成特征值向量,H和W分别代表所述训练样本的宽与高;对所述特征值向量进行计算,以生成所述训练样本归属良品和非良品的概率分布;根据所述训练样本归属良品和非良品的概率分布、所述训练样本归属良品和非良品的真实概率分布与所述初始AI神经网络模型的损失函数计算损失值,生成损失值变化数据,所述损失值变化数据为每一次训练生成的损失值的统计数据;判断所述损失值变化数据在预设区间内是否小于预设阈值;若所述损失值变化数据在预设区间内小于预设阈值,则确定所述初始AI神经网络模型为目标AI神经网络模型。2.根据权利要求1中所述的训练方法,其特征在于,在判断所述损失值变化数据在预设区间内是否小于预设阈值之后,所述训练方法还包括:若所述损失值变化数据在预设区间内不小于预设阈值,则判断所述训练样本的训练次数是否达标;若所述训练样本的训练次数达标,根据小批梯度下降法更新所述初始AI神经网络模型的权值,并把训练过程中获取到的所述训练样本的特征和所述概率分布进行模型保存;从所述训练样本集中重新选取训练样本输入所述初始AI神经网络模型中训练。3.根据权利要求2中所述的训练方法,其特征在于,在所述确定所述初始AI神经网络模型为目标AI神经网络模型之后,所述训练方法还包括:获取目标显示屏图像,并将所述目标显示屏图像输入目标AI神经网络模型,所述目标显示屏图像为目标显示屏的拍摄图像;
将所述目标显示屏图像归属良品和非良品的概率分布中最大概率值输出;通过检测软件检测所述目标显示屏图像的归属良品和非良品的检测结果;根据所述最大概率值与所述检测结果输出所述目标显示屏的检测结果。4.根据权利要求2中所述的训练方法,其特征在于,在判断所述训练样本的训练次数是否达标之后,所述训练方法还包括:若所述训练样本的训练次数未达标,则根据小批梯度下降法更新所述初始AI神经网络模型的权值,并将所述训练样本重新输入所述初始AI神经网络模型中训练。5.根据权利要求1至4中任一项所述的训练方法,其特征在于,所述通过特征金字塔网络对所述训练样本进行卷积特征提取,生成第一样本特征,包括:通过特征金字塔网络对所述训练样本依次进行多层次卷积处理、特征通道融合处理、通道降维处理、上采样处理、二次卷积采样处理和通道叠加处理,生成第一样本特征。6.根据权利要求1至4中任一项所述的训练方法,其特征在于,所述通过Trans模块对所述第二样本特...

【专利技术属性】
技术研发人员:乐康张耀张滨徐大鹏曹保桂
申请(专利权)人:深圳精智达技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1