一种可变形活体小目标的深度学习智能识别方法技术

技术编号：24093625 阅读：29 留言：0更新日期：2020-05-09 09:13

本发明专利技术涉及一种可变形活体小目标的深度学习智能识别方法，属于机器人视觉及其智能识别技术领域；本发明专利技术将可变形卷积模块和可变形ROI池化模块与Faster R‑CNN进行合理的结合，使用可变形网络的可变形卷积模块和可变形ROI池化模块对模型进行改进，对标准卷积的空间取样点和普通ROI池化加入二维甚至高维偏移，使得卷积的取样点发生形状变化，提高改进后模型的可变形特性，改进模型提高了对可变形目标的检测识别效果；考虑对不同层的特征图进行融合，对底层特征图池化处理降低分辨率，对高层特征逆卷积处理提高分辨率，然后融合低、中、高三层特征图；同时考虑增加一组小尺度预选框，增加小目标预选框的生成数量，改进模型提高了对小目标的检测识别效果。

A deep learning intelligent recognition method for small deformable living objects

全部详细技术资料下载

【技术实现步骤摘要】
一种可变形活体小目标的深度学习智能识别方法
本专利技术涉及一种可变形活体小目标的深度学习智能识别方法，属于机器人视觉及其智能识别

技术介绍
机器人视觉及其智能识别技术，是机器人获取外界信息的最主要手段之一，目前已广泛用于机器人领域的探测、目标跟踪、作业等多个领域。然而，随着技术的变革和人们对系统效能提升的需要，视觉智能技术不仅需要机器人针对不同场景对小尺度目标进行检测和识别，而且需要可变形的活体目标进行视觉检测和识别。针对可变形活体目标检测困难的问题，当前主要有两类解决方法。第一类是建立一个目标拥有足够多的变化形状的训练集，这种方法主要通过增广已有数据实现。这种方法主要通过消耗大量的训练和复杂的模型参数来实现鲁棒性的检测可变形目标。第二类方法是使用具有变换不变性的特征和算法，这一类方法包含很多经典算法如SIFT即scaleinvariantfeaturetransform和基于滑窗的目标检测范例。然而，上述提及的方法存在这两个缺点。首先，几何变换是固定且已知的，这个先验知识被用来设计增广数据和设计特征和算法，然而，对于活体目标，其形状的变换有多种形式，而增广得到的目标形态是有限的，因此这种方法对与那些未增广到的形态就无法处理其未知的几何变换。第二，对于过分复杂的变换，即使变换已知，人为地设计不变特征和算法也是难以实现和不可行的。
技术实现思路
本专利技术的目的是为了提高对可变形目标的检测效果而提供一种可变形活体小目标的深度学习智能识别方法。本专利技术的目的是这样实现的，一...

【技术保护点】
1.一种可变形活体小目标的深度学习智能识别方法，其特征在于，具体包括以下步骤：/n步骤1.可变形卷积模块替换基础卷积单元：对标准卷积的空间取样点加入二维甚至高维偏移，使卷积的取样点发生形状变化；/n步骤2.可变形ROI池化模块替换ROI池化层：对普通ROI即Region of Interest池化在每一个方格的位置添加一个二维甚至高维偏移，以改善卷积神经网络可变形能力，得到可变形卷积网络，提高卷积神经网络对可变形目标的检测和识别能力；/n步骤3.针对小目标的检测和识别，用一种基于逆卷积和多层特征融合的结构对FasterR-CNN模型进行改进，使小目标预选框获得的信息量更丰富；/n步骤4.在Faster R-CNN网络中，RPN网络被用来生成预选框，然后算法对这些预选框进行分类和回归，对锚点机制改进，在锚点中增加一组小尺度预选框，使RPN可生成更多的小目标预选框，提高对小目标的检测和识别效果。/n

【技术特征摘要】
1.一种可变形活体小目标的深度学习智能识别方法，其特征在于，具体包括以下步骤：
步骤1.可变形卷积模块替换基础卷积单元：对标准卷积的空间取样点加入二维甚至高维偏移，使卷积的取样点发生形状变化；
步骤2.可变形ROI池化模块替换ROI池化层：对普通ROI即RegionofInterest池化在每一个方格的位置添加一个二维甚至高维偏移，以改善卷积神经网络可变形能力，得到可变形卷积网络，提高卷积神经网络对可变形目标的检测和识别能力；
步骤3.针对小目标的检测和识别，用一种基于逆卷积和多层特征融合的结构对FasterR-CNN模型进行改进，使小目标预选框获得的信息量更丰富；
步骤4.在FasterR-CNN网络中，RPN网络被用来生成预选框，然后算法对这些预选框进行分类和回归，对锚点机制改进，在锚点中增加一组小尺度预选框，使RPN可生成更多的小目标预选框，提高对小目标的检测和识别效果。

2.根据权利要求1所述一种可变形活体小目标的深度学习智能识别方法，其特征在于：所述可变形卷积网络中包含可变形卷积模块、可变形ROI池化模块和可变形位置敏感的ROI池化模块；卷积神经网络中的卷积和特征图都是三维的，可变形卷积是在二维空间域操作的，在不同的通道维度之间，可变形卷积操作都是相同的。

3.根据权利要求1所述一种可变形活体小目标的深度学习智能识别方法，其特征在于：所述步骤1是对可变形卷积的二维操作描述，具体包括对标准卷积的空间取样点加入二维甚至高维偏移，使卷积的取样点发生形状变化；偏移量通过对同一个输入特征图进行卷积操作得到，卷积操作的卷积核和之前卷积层保持同样的分辨率和膨胀值；输出的偏移域与输入的特征图有相同的空间分辨率，偏移域的通道数是输入特征图通道数的两倍，这对应卷积每个取样位置的二维的偏移，在训练中，生成输出特征图的卷积核和生成偏移域的卷积核同时进行学习，为学习得到偏移域，梯度是通过下面两公式的双线性操作反向运算得到：

G(q,p)＝g(qx,px)·g(qy,py)
式中，p表示任意的取样点位置，在可变形ROI池化模块中梯度相对偏移量Δpij的计算公式中，p＝p0+pn+Δpn，q表示输入特征图In中的所有整型空间遍历点，G(.,.)表示双线性插值核，g(a,b)＝max(0,1-|a-b|)；
在可变形卷积公式中，梯度相对于偏移量Δpn的计算公式为：

式中，可通过公式G(q,p)＝g(qx,px)·g(qy,py)求导得出，注意到Δpn是一个二维量，为了简化，我们使用来替代和

4.根据权利要求1所述一种可变形活体小...

【专利技术属性】
技术研发人员：黄海，靳佰达，万兆亮，周浩，石晓婷，吴晗，梅洋，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：黑龙;23

全部详细技术资料下载我是这个专利的主人