【技术实现步骤摘要】
本专利技术属于计算机视觉
,尤其涉及图像分类的方法及装置。
技术介绍
图像分类技术是指通过计算机算法判断图像内容如物体、场景等所属的类别。而图像分类技术中图像的特征表示将直接影响最终的判断结果。随着深度学习的发展,使用大量数据训练的卷积神经网络模型成为主要的图像分类技术,该技术利用卷积神经网络中的全连接层作为图像的特征表示,然后利用SoftMax等分类器进行分类,在实际应用中取得了较好的效果。然而,全连接层的图像特征表示的是图像的高层语义特征,主要描述图像的整体布局。但在许多图像中,例如:卧室和客厅,整体布局相同,但是客厅一般只放沙发,卧室只放床。而这些物体上的差异信息高层语义特征往往无法表述,影响了图像分类的准确率。
技术实现思路
鉴于此,本专利技术实施例提供一种图像分类的方法及装置,以提高图像分类的准确率。第一方面,本专利技术实施例提供了一种图像分类的方法,所述方法包括:通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;对提取的所述中间卷积层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取后的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;基于融合后的特征进行图像分类。第二方面,一种图像分类的装置,所述装置包括:特征提取单元,用于通过卷积神 ...
【技术保护点】
一种图像分类的方法,其特征在于,所述方法包括:通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;对提取的所述中间卷积层的特征以及全连接层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;基于融合后的特征进行图像分类。
【技术特征摘要】
1.一种图像分类的方法,其特征在于,所述方法包括:
通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;
对提取的所述中间卷积层的特征以及全连接层的特征进行预处理,并对预处理后的中
间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进
行归一化处理后作为图像表示的高层语义特征;
将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;
基于融合后的特征进行图像分类。
2.如权利要求1所述的图像分类的方法,其特征在于,提取的所述中间卷积层的特征为
...
【专利技术属性】
技术研发人员:乔宇,郭胜,黄韡林,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。