【技术实现步骤摘要】
基于中层卷积神经网络多维度特征的场景识别方法
[0001]本专利技术属于人工智能领域,具体涉及一种基于中层卷积神经网络多维度特征的场景识别方法。
技术介绍
[0002]场景识别是计算机视觉领域的一个热门研究问题,是指利用计算机对场景图像进行分析处理,以识别各种不同的场景属性。场景识别被广泛应用到了多个领域,包括机器人定位、导航,地图构建等。大多数的场景识别的方法基于局部特征的出现,如尺度不变特征转换(Scale Invariant Feature Transform,SIFT)、梯度方向直方图(Histogram of Oriented Gridients,HOG)特征,以及它们的聚合表达,如特征包等。然而,SIFT等底层特征建立在数据统计基础上,能够直接从图像中获取不需要外部知识。并且SIFT、HOG等特征都是图像局部特征且为人工设计的特征,忽视了图像中的隐含信息。因此,能够从训练数据中自动学习特征的深度卷积神经网络(Convolutional Neural Networks,CNN)获得了大量关注。深度卷积神经网络提取的 ...
【技术保护点】
【技术特征摘要】
1.一种基于中层卷积神经网络多维度特征的场景识别方法,其特征在于,该方法包括如下步骤:S1.利用滑动窗口策略提取图像块;S2.提取图像块HOG特征,对图像块聚类,并训练SVM分类器;S3.利用分类器在训练集中检测与聚类中图像块相似的图像块,并将图像块作为候选的具有区分度的中层图像块;S4.提取中层图像块CNN全连接层特征和整幅图像的CNN全连接层特征,对两种特征进行叠加;S5.利用SVM分类器对特征进行分类。2.如权利要求1所述的基于中层卷积神经网络多维度特征的场景识别方法,其特征在于,所述步骤S1之前还包括:假设数据集中包含了多类场景,将每一类场景的训练集分为两部分,D1和D2。3.如权利要求2所述的基于中层卷积神经网络多维度特征的场景识别方法,其特征在于,所述步骤S2中提取图像块HOG特征具体包括:利用滑动窗口对某一类场景的D1随机采样得到图像块,对图像块提取梯度直方图特征。4.如权利要求3所述的基于中层卷积神经网络多维度特征的场景识别方法,其特征在于,所述步骤S2中对图像块聚类具体包括:利用K
‑
means对图像块进行聚类。5.如权利要求3所述的基于中层卷积神经网络多维度特征的场景识别方法,其特征在于,所述对图像块提取梯度直方图特征具体包括如下步骤:首先,灰度化图像;然后分割图像,划分成若干个均匀的元胞cell,计算每一个元胞中各个像素的梯度,统计元胞内所有像素的梯度方向直方图;把元胞cell组合成一个块(block),统计该块中的所有直方图,得到该块的特征描述子;最后把图像中所有块的描述子联合,获取整幅图像的HOG特征描述子。6.如权利要求5所述的基于中层卷积神经网络多维度特征的场景识别方法,其特征在于,所述灰度化图像具体包括:对于彩色RGB图像,首先将其转化为灰度图像:Gray=0.3
×
R+0.59
×
G+0.11
×
B。7.如权利要求6所述的基于中层卷积神经网络多维度特征的场景识别方法,其特征在于,所述计算每一个元胞中各个...
【专利技术属性】
技术研发人员:杨飞,邹琴,邓雪,丁晓东,平笑柔,
申请(专利权)人:北京计算机技术及应用研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。