基于DCL和Cascade的图像精细识别方法技术

技术编号:25481105 阅读:42 留言:0更新日期:2020-09-01 23:02
本发明专利技术公开了一种基于DCL和Cascade的图像精细识别方法,遵照DCL(Destruction and Construction Learning)理念对原始图像输入按块进行打乱,进而破坏原始图像中的结构信息,然后再通过Cascade(级联)级联分类器训练神经网络识别被破坏”局部区域顺序的图像,强迫神经网络抓住重点视觉区域,通过级联弱分类器及强分类器提高图像识别精细度和识别效率,细至纹理信息,方法独特,增强了神经网络对具有区分度局部细节的特征学习能力,高于人脸识别能力,在物联网和人工智能精细识别领域,具有良好的应用前景。

【技术实现步骤摘要】
基于DCL和Cascade的图像精细识别方法
本专利技术涉及人工智能图像识别
,具体涉及一种基于DCL和Cascade的图像精细识别方法。
技术介绍
随着科学技术的快速进步,在过去十年,通用目标识别借助大规模标注数据和复杂的模型设计取得了稳步进展。然而,识别精细物体类别(例如,鸟类、蝴蝶、汽车模型、SKU级商品)仍然是一项具有挑战性的任务。差异细微的物体在视觉上往往类似粗略一瞥,但它们可以通过有区别的局部区域细节来正确识别,所以从有区别的目标局部学习判别特征表示在精细图像识别中起关键作用。现有的精细识别方法可以大致分为两类,具体如下:(1)一种是首先定位有判别性的目标局部区域,然后根据这些判别区域进行分类,这种两步法需要在目标或目标局部上添加额外的边界框标注,这些标注的成本往往都很高;(2)另一种是试图以无监督的方式通过注意力机制自动定位判别区域,因此不需要额外的注释。然而,这些方法通常需要额外的网络结构(例如,注意力机制),因此为训练和预测阶段引入了额外的计算开销。因此,如何克服上述问题,提高精细识别方法的精确度本文档来自技高网...

【技术保护点】
1.基于DCL和Cascade的图像精细识别方法,其特征在于:包括以下步骤,/n步骤(A),原始图像生成后,对原始图像的数据进行初始分析,该原始图像为高清图像;/n步骤(B),基于DCL图像破坏算法,破坏初始分析后的原始图像以强调有判别性的局部区域的细节,对局部区域之间的语义相关性建模以重建图像,使网络基于判别性的局部细节对重建图像进行分类;/n步骤(C),引入噪声模式和区域重建损失模式,使重建图像解决对抗性损失和区域对齐损失,得到精细识别图像;/n步骤(D),基于神经网络通过级联学习专家的知识分类器,由弱至强以对破坏重构图像的强度进行分类,形成知识分类器;/n步骤(E),通过与知识分类器的比...

【技术特征摘要】
1.基于DCL和Cascade的图像精细识别方法,其特征在于:包括以下步骤,
步骤(A),原始图像生成后,对原始图像的数据进行初始分析,该原始图像为高清图像;
步骤(B),基于DCL图像破坏算法,破坏初始分析后的原始图像以强调有判别性的局部区域的细节,对局部区域之间的语义相关性建模以重建图像,使网络基于判别性的局部细节对重建图像进行分类;
步骤(C),引入噪声模式和区域重建损失模式,使重建图像解决对抗性损失和区域对齐损失,得到精细识别图像;
步骤(D),基于神经网络通过级联学习专家的知识分类器,由弱至强以对破坏重构图像的强度进行分类,形成知识分类器;
步骤(E),通过与知识分类器的比对,按照事先要求的正确率对步骤(C)得到的精细识别图像,进行识别和判定。


2.根据权利要求1所述的基于DCL和Cascade的图像精细识别方法,其特征在于:步骤(B),基于DCL图像破坏算法,破坏初始分析后的原始图像以强调有判别性的局部区域的细节,对局部区域之间的语义相关性建模以重建图像,使网络基于判别性的局部细节对重建图像进行分类,包括以下步骤,
(B1),给定原始图像I,首先将图像均匀地划分为N×N个子区域,每个子区域由Ri,j表示,其中i,j分别是水平和垂直索引,1≤i,j≤N;
(B2),将子区域Ri,j的局部区域混合在它们的2D邻域中,对于第j行的子区域,会生成长度为N的随机向量数列qj,其中,第i个元素qj,i=i+r,是服从均匀分布的随机变量,k是定义邻域范围的可调参数(1≤k<N);
(B3),通过对随机向量数列qj重新排序得到第j行区域的新排列这样就把原始图像中的区域坐标由(i,j)转换到了σ(i,j),以重建图像。


3.根据权利要求1所述的基于DCL和Cascade的图像精细识别方法,其特征在于:步骤(C),引入噪声模式和区域重建损失模式,使重建图像解决对抗性损失和区域对齐损失,得到精细识别图像,包括以下步骤,
(C1),引入噪声模式,使重建图像解决对抗性损失
原始图像I,使用表示第m层的第k个特征图,对主干分类网络ResNet-50的特征可视化,包含使用和不使用对抗性损失两种情况,取最后一个全连接层前面的层的输出特征来进行对抗性学习,第m个卷积层的第k个卷积核对应真实类别c的响应为,



其中,是第k个特征图和对应的类别c之间的权重,即响应rk(I,c)等于第k个卷积核对应的特征图乘以全连接层对应c的权...

【专利技术属性】
技术研发人员:李旻沈华飞
申请(专利权)人:南京南大智慧城市规划设计股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1