一种基于可变形卷积神经网络的红外图像物体识别方法技术

技术编号:19009475 阅读:40 留言:0更新日期:2018-09-22 09:18
本发明专利技术公开了一种基于可变形卷积神经网络的红外图像物体识别方法,包括构建训练集与测试集,搭建卷积神经网络架构,在最后一层加上softmax分类器,设置目标函数,采用线性或非线性变形的卷积核进行采样并在池化层采用目前业界最好的基于规则块采样的兴趣区域(region of interests,ROI)池化方法进行池化操作;按经验设置学习率参数,能很容易进行标准反向传播端到端的训练,从而得到可变形卷积网络。经实验证明,本发明专利技术在卷积神经网络中引入了学习空间几何形变的能力,更好地解决了具有空间形变的图像识别任务。提高了卷积神经网络的几何变换建模的能力,在目标检测和识别这些视觉任务上的有效性,成功学习到空间上密集的几何形变。

A method of infrared image object recognition based on deformable convolution neural network

The invention discloses an infrared image object recognition method based on deformable convolution neural network, which includes constructing training set and test set, constructing convolution neural network framework, adding soft Max classifier at the last layer, setting object function, sampling with linear or nonlinear deformable convolution kernel and adopting pooling layer. At present, the best region of interest (ROI) pooling method based on rule block sampling is pooling operation; setting learning rate parameters according to experience, it is easy to carry out end-to-end training of standard back-propagation, thus obtaining deformable convolution network. Experiments show that the invention introduces the ability of learning spatial geometric deformation in convolution neural network, and better solves the image recognition task with spatial deformation. The geometric transformation modeling ability of convolutional neural network is improved, and the validity of object detection and recognition is improved. The dense geometric deformation in space is successfully learned.

【技术实现步骤摘要】
一种基于可变形卷积神经网络的红外图像物体识别方法
本专利技术涉及人机交互、计算机视觉领域及物体识别领域,更具体地,涉及一种基于可变形卷积神经网络的红外图像物体识别方法。
技术介绍
体识别是计算机视觉中一个十分重要的研究领域,包含人脸识别、手写体数字识别、手势识别以及物体识别等,可以广泛地应用于人机交互、图像分类以及图像检索等领域。衡量一个物体识别系统好坏的两个主要指标为:识别率核识别速度。一般情况而言,识别率越高意味着识别速度相对较慢,而识别速度越快意味着识别率相对较低。因此,如何权衡而这的利弊一直是物体识别领域一个不可回避的问题。物体识别系统主要包含特征提取、分类器判别等两个方面。近年来,卷积神经网络算法的发展极大地提高了物体识别技术的正确率,大部分已存在的卷积神经网络的深度结构改进方法大都趋向于调优网络的宽度与深度、改进激励函数、设计多样的卷积操作等等。2015年Simonyan和Zisserman提出VGG卷积神经网络,他们通过研究卷积神经网络的深度与大尺度图片识别精度的关系,提出了一个更深的卷积神经网络架构。通过调优网络的宽度与深度,达到了最当时最好的性能。2014年Min等本文档来自技高网...
一种基于可变形卷积神经网络的红外图像物体识别方法

【技术保护点】
1.一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,包括以下步骤:S1:收集数据库样本并设定训练集与测试集,其中数据库样本采用COCO、PASCAL VOC并设定类别和每一个类别在分类器中的编码,构建训练集;S2:搭建卷积神经网络架构,通过交迭若干个卷积层和池化层设置卷积神经网络的深度与宽度架构;S3:在卷积层采用可变形卷积核进行采样,通过加入一个额外的卷积层来学习offset偏移量,共享输入特征图,然后把输入特征图和训练得到的offset偏移量共同作为可变形卷积层的输入层,此时可变形卷积层采样点发生偏移,再进行卷积;S4:在池化层采用可变形兴趣区域进行池化操作,其中ROI被分为...

【技术特征摘要】
1.一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,包括以下步骤:S1:收集数据库样本并设定训练集与测试集,其中数据库样本采用COCO、PASCALVOC并设定类别和每一个类别在分类器中的编码,构建训练集;S2:搭建卷积神经网络架构,通过交迭若干个卷积层和池化层设置卷积神经网络的深度与宽度架构;S3:在卷积层采用可变形卷积核进行采样,通过加入一个额外的卷积层来学习offset偏移量,共享输入特征图,然后把输入特征图和训练得到的offset偏移量共同作为可变形卷积层的输入层,此时可变形卷积层采样点发生偏移,再进行卷积;S4:在池化层采用可变形兴趣区域进行池化操作,其中ROI被分为n*n个bin,被输入到一个额外的全连接层学习offset,然后通过一个可变形兴趣区域池化层使每个bin发生偏移;S5:在卷积神经网络的最后一层加上softmax分类器并设置目标函数;S6:设置学习率参数,采用后向传播算法,使用训练集训练卷积神经网络模型一次,使用的得到的训练后的模型去识别测试集数据,统计整体识别率;S7:重复步骤S6,直到目标函数值完全收敛,识别率不再提高为止,此时网络参数训练完毕,得到可变形卷积神经网络模板,即红外图像物体识别系统;S8:应用该系统进行红外图像识别。2.根据权利要求1所述的一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,步骤S1所...

【专利技术属性】
技术研发人员:肖立军廖志伟邹国惠裴星宇万新宇李晨熙韩玉龙吴伟力覃佳奎姜媛
申请(专利权)人:广东电网有限责任公司广东电网有限责任公司珠海供电局
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1