The invention discloses an infrared image object recognition method based on deformable convolution neural network, which includes constructing training set and test set, constructing convolution neural network framework, adding soft Max classifier at the last layer, setting object function, sampling with linear or nonlinear deformable convolution kernel and adopting pooling layer. At present, the best region of interest (ROI) pooling method based on rule block sampling is pooling operation; setting learning rate parameters according to experience, it is easy to carry out end-to-end training of standard back-propagation, thus obtaining deformable convolution network. Experiments show that the invention introduces the ability of learning spatial geometric deformation in convolution neural network, and better solves the image recognition task with spatial deformation. The geometric transformation modeling ability of convolutional neural network is improved, and the validity of object detection and recognition is improved. The dense geometric deformation in space is successfully learned.
【技术实现步骤摘要】
一种基于可变形卷积神经网络的红外图像物体识别方法
本专利技术涉及人机交互、计算机视觉领域及物体识别领域,更具体地,涉及一种基于可变形卷积神经网络的红外图像物体识别方法。
技术介绍
体识别是计算机视觉中一个十分重要的研究领域,包含人脸识别、手写体数字识别、手势识别以及物体识别等,可以广泛地应用于人机交互、图像分类以及图像检索等领域。衡量一个物体识别系统好坏的两个主要指标为:识别率核识别速度。一般情况而言,识别率越高意味着识别速度相对较慢,而识别速度越快意味着识别率相对较低。因此,如何权衡而这的利弊一直是物体识别领域一个不可回避的问题。物体识别系统主要包含特征提取、分类器判别等两个方面。近年来,卷积神经网络算法的发展极大地提高了物体识别技术的正确率,大部分已存在的卷积神经网络的深度结构改进方法大都趋向于调优网络的宽度与深度、改进激励函数、设计多样的卷积操作等等。2015年Simonyan和Zisserman提出VGG卷积神经网络,他们通过研究卷积神经网络的深度与大尺度图片识别精度的关系,提出了一个更深的卷积神经网络架构。通过调优网络的宽度与深度,达到了最当时最好的性能。2014年Min等人提出了一种深度网络结构叫做NIN卷积神经网络。在该网络结构中,作者引入了1*1的卷积操作,通过级联两层这样的卷积层,实现了多层感知器的功能,在拉深网络深度,调优网络宽度的同时,实现了当时最优的分类性能。基于卷积神经网络的物体识别算法中,特征提取占据了物体识别的大部时间,特征提取的精确度也决定着算法的性能。然而上述方法的特征提取的精确度依然存在不可忽视的局限性。这些局限来自于卷 ...
【技术保护点】
1.一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,包括以下步骤:S1:收集数据库样本并设定训练集与测试集,其中数据库样本采用COCO、PASCAL VOC并设定类别和每一个类别在分类器中的编码,构建训练集;S2:搭建卷积神经网络架构,通过交迭若干个卷积层和池化层设置卷积神经网络的深度与宽度架构;S3:在卷积层采用可变形卷积核进行采样,通过加入一个额外的卷积层来学习offset偏移量,共享输入特征图,然后把输入特征图和训练得到的offset偏移量共同作为可变形卷积层的输入层,此时可变形卷积层采样点发生偏移,再进行卷积;S4:在池化层采用可变形兴趣区域进行池化操作,其中ROI被分为n*n个bin,被输入到一个额外的全连接层学习offset,然后通过一个可变形兴趣区域池化层使每个bin发生偏移;S5:在卷积神经网络的最后一层加上softmax分类器并设置目标函数;S6:设置学习率参数,采用后向传播算法,使用训练集训练卷积神经网络模型一次,使用的得到的训练后的模型去识别测试集数据,统计整体识别率;S7:重复步骤S6,直到目标函数值完全收敛,识别率不再提高为止,此时网络参数训练完 ...
【技术特征摘要】
1.一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,包括以下步骤:S1:收集数据库样本并设定训练集与测试集,其中数据库样本采用COCO、PASCALVOC并设定类别和每一个类别在分类器中的编码,构建训练集;S2:搭建卷积神经网络架构,通过交迭若干个卷积层和池化层设置卷积神经网络的深度与宽度架构;S3:在卷积层采用可变形卷积核进行采样,通过加入一个额外的卷积层来学习offset偏移量,共享输入特征图,然后把输入特征图和训练得到的offset偏移量共同作为可变形卷积层的输入层,此时可变形卷积层采样点发生偏移,再进行卷积;S4:在池化层采用可变形兴趣区域进行池化操作,其中ROI被分为n*n个bin,被输入到一个额外的全连接层学习offset,然后通过一个可变形兴趣区域池化层使每个bin发生偏移;S5:在卷积神经网络的最后一层加上softmax分类器并设置目标函数;S6:设置学习率参数,采用后向传播算法,使用训练集训练卷积神经网络模型一次,使用的得到的训练后的模型去识别测试集数据,统计整体识别率;S7:重复步骤S6,直到目标函数值完全收敛,识别率不再提高为止,此时网络参数训练完毕,得到可变形卷积神经网络模板,即红外图像物体识别系统;S8:应用该系统进行红外图像识别。2.根据权利要求1所述的一种基于可变形卷积神经网络的红外图像物体识别方法,其特征在于,步骤S1所...
【专利技术属性】
技术研发人员:肖立军,廖志伟,邹国惠,裴星宇,万新宇,李晨熙,韩玉龙,吴伟力,覃佳奎,姜媛,
申请(专利权)人:广东电网有限责任公司,广东电网有限责任公司珠海供电局,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。