【技术实现步骤摘要】
基于具有RoI池化的双CNN网络的目标识别方法
本专利技术涉及数字图像处理
,尤其涉及一种基于具有RoI(RegionofInterest,兴趣区)池化的双CNN(ConvolutionNeuralNetwork,卷积神经网络)网络的目标识别方法。
技术介绍
无人机、机器人等各种智能无人系统的应用越来越广泛,对视觉系统的目标检测与识别的速率和准确率的要求也随之越来越高。常用的目标识别方法有基于模板匹配、基于语法结构分析、基于神经网络以及单纯的基于传统统计方法等,图像目标识别中较为常用的则如基于卷积神经网络CNN的目标识别方法。基于CNN的目标识别方法是利用卷积神经网络的多层卷积层的卷积作用来获得能够代表数字图像的特征矩阵,然后再将获得的特征矩阵输入分类器以实现分类、识别等。目前基于CNN的目标识别方法,通常都是先将原图像划分成若干个候选框,然后利用常规的CNN对候选框进行逐个提取特征,再对提取的特征进行分类,进行目标检测以便于目标的识别,主要包括以下几种方法,且均存在一定的缺陷;(1)RCNN(RichfeaturehierarchiesbasedCNN)方 ...
【技术保护点】
一种基于具有RoI池化的双CNN网络的目标识别方法,其特征在于,步骤包括:S1.将待识别图像通过第一级CNN网络获取目标区域窗口,以及通过具有RoI池化层的第二级CNN网络获取待识别图像的全局特征图;S2.将获取到的所述全局特征图、目标区域窗口输入所述第二级CNN网络的RoI池化层中进行池化处理,提取出所述目标区域窗口指定维数的特征向量;S3.将所述步骤S2提取到的特征向量训练分类器,根据训练得到的分类器检测待识别图像中的目标,输出识别结果。
【技术特征摘要】
1.一种基于具有RoI池化的双CNN网络的目标识别方法,其特征在于,步骤包括:S1.将待识别图像通过第一级CNN网络获取目标区域窗口,以及通过具有RoI池化层的第二级CNN网络获取待识别图像的全局特征图;S2.将获取到的所述全局特征图、目标区域窗口输入所述第二级CNN网络的RoI池化层中进行池化处理,提取出所述目标区域窗口指定维数的特征向量;S3.将所述步骤S2提取到的特征向量训练分类器,根据训练得到的分类器检测待识别图像中的目标,输出识别结果。2.根据权利要求1所述的基于具有RoI池化的双CNN网络的目标识别方法,其特征在于,所述步骤S1中获取目标区域窗口的具体步骤为:S11.将待识别图像通过所述第一级CNN网络的多层卷积层进行卷积处理,分别获得包含有目标区域窗口、背景区域窗口的多个区域窗口;S12.区分获得的多个所述区域窗口中目标区域窗口、背景区域窗口后,去除所述背景区域窗口、保留指定个数的所述目标区域窗口,输出对应各个所述目标区域窗口的RoI元组。3.根据权利要求2所述的基于具有RoI池化的双CNN网络的目标识别方法,其特征在于:所述步骤S12中具体分别对各个所述区域窗口的边界计算IoU值,根据计算得到的IoU值区分目标区域窗口、背景区域窗口。4.根据权利要求3所述的基于具有RoI池化的双CNN网络的目标识别方法,其特征在于:所述步骤S11后、步骤S12前还包括确定各个所述区域窗口的边界步骤。5.根据权利要求1~4中任意一项所述的基于具有RoI池化的双CNN网络的目标识别方法,其特征在于,所述步骤S1中全局特征图的具体获取步骤为:将待识别图像通过所述第二级CNN网络的多层卷积层进行卷积处理,输出...
【专利技术属性】
技术研发人员:江天,彭元喜,彭学锋,舒雷志,张松松,宋明辉,周士杰,肖震,赵健宏,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。