图像分类的方法及装置制造方法及图纸

技术编号:14869877 阅读:68 留言:0更新日期:2017-03-21 01:59
本发明专利技术适用于计算机视觉技术领域,提供了一种图像分类的方法及装置。该方法包括:通过深度卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;对提取的所述中间卷积层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;基于融合后的特征进行图像分类。通过本发明专利技术,可有效提高图像内容识别的准确率,进而提高图像分类的准确率。

【技术实现步骤摘要】

本专利技术属于计算机视觉
,尤其涉及图像分类的方法及装置
技术介绍
图像分类技术是指通过计算机算法判断图像内容如物体、场景等所属的类别。而图像分类技术中图像的特征表示将直接影响最终的判断结果。随着深度学习的发展,使用大量数据训练的卷积神经网络模型成为主要的图像分类技术,该技术利用卷积神经网络中的全连接层作为图像的特征表示,然后利用SoftMax等分类器进行分类,在实际应用中取得了较好的效果。然而,全连接层的图像特征表示的是图像的高层语义特征,主要描述图像的整体布局。但在许多图像中,例如:卧室和客厅,整体布局相同,但是客厅一般只放沙发,卧室只放床。而这些物体上的差异信息高层语义特征往往无法表述,影响了图像分类的准确率。
技术实现思路
鉴于此,本专利技术实施例提供一种图像分类的方法及装置,以提高图像分类的准确率。第一方面,本专利技术实施例提供了一种图像分类的方法,所述方法包括:通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;对提取的所述中间卷积层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取后的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;基于融合后的特征进行图像分类。第二方面,一种图像分类的装置,所述装置包括:特征提取单元,用于通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;处理单元,用于对提取的所述中间卷积层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取后的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;融合单元,用于将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;分类单元,用于基于融合后的特征进行图像分类。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术实施例通过卷积神经网络提取输入图像的中间卷积层的特征,对提取的所述中间卷积层的特征进行预处理后编码成图像表示的中层语义特征,并将所述图像表示的中层语义特征和图像表示的高层语义特征进行融合,通过融合后的混合特征来表示图像信息,由于融合后的混合特征不仅能够体现图像的高层全局语义特征而且也能很好的体现图像的细节和局部信息,因此效果相比单一的全连接层特征有明显提高,可有效提高图像内容识别的准确率,进而提高图像分类的准确率,具有较强的易用性和实用性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的图像分类的方法的实现流程示意图;图2是本专利技术实施例提供的图像分类的装置的组成结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透切理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。请参阅图1,图1示出了本专利技术实施例提供的图像分类的方法的实现流程,该方法可适用于各类终端设备,如个人计算机、平板电脑、手机等。该方法过程详述如下:步骤S101,通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征。需要说明的是,所述卷积神经网络包含多个卷积层,不同的卷积层所包含的信息不同。本实施例所述中间卷积层可以看做是一个三维矩阵,因此提取的所述中间卷积层的特征为F=m×n×k,其中m×n为每个卷积特征图的大小,k为卷积特征图(卷积滤波器)的个数。在步骤S102中,对提取的所述中间卷积层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取后的全连接层的特征进行归一化处理后作为图像表示的高层语义特征。在本实施例中,所述对提取的所述中间卷积层的特征进行预处理包括:将每个特征图处理成一列mn,得到一个二维数组(大小为mn×k),对所述二维数组进行归一化和降维处理,得到最后的特征X=[x1;x2;...;xk],其中xt表示一个k维的行特征,t=1,2,...,k,X可以作为所有行特征的集合。本实施例还包括对X中的行特征进行编码,以形成图像表示的中层语义特征,具体如下:令X={xt本文档来自技高网...

【技术保护点】
一种图像分类的方法,其特征在于,所述方法包括:通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;对提取的所述中间卷积层的特征以及全连接层的特征进行预处理,并对预处理后的中间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进行归一化处理后作为图像表示的高层语义特征;将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;基于融合后的特征进行图像分类。

【技术特征摘要】
1.一种图像分类的方法,其特征在于,所述方法包括:
通过卷积神经网络提取输入图像的中间卷积层的特征以及全连接层的特征;
对提取的所述中间卷积层的特征以及全连接层的特征进行预处理,并对预处理后的中
间卷积层的特征进行编码,以形成图像表示的中层语义特征,对提取的全连接层的特征进
行归一化处理后作为图像表示的高层语义特征;
将所述图像表示的中层语义特征和所述图像表示的高层语义特征进行融合;
基于融合后的特征进行图像分类。
2.如权利要求1所述的图像分类的方法,其特征在于,提取的所述中间卷积层的特征为
...

【专利技术属性】
技术研发人员:乔宇郭胜黄韡林
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1