一种图像特征提取方法及装置制造方法及图纸

技术编号:11938596 阅读:80 留言:0更新日期:2015-08-26 09:54
本发明专利技术实施例公开了一种图像特征提取方法及装置,用于在无监督图像训练过程中进行高效的图像特征提取。本发明专利技术实施例方法包括:对输入图像的待提取像素所在的图像区域内的区域像素进行稀疏编码,从而得到所述区域像素的M维的编码系数;根据所述区域像素的编码系数,获得所述图像区域对应的M个稀疏编码图;分别对所述M个稀疏编码图进行池化处理,从而得到所述待提取像素的M维的池化特征;对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的约减特征,所述约减特征的维度小于所述池化特征的维度。

【技术实现步骤摘要】

本专利技术设及通信技术,尤其设及一种图像特征提取方法及装置
技术介绍
特征提取是许多计算机视觉分析任务(如场景识别、物体识别、目标检测)的关键 步骤。因此,如何提取判别性强、鲁椿性高的特征一直是一个研究热点。传统意义上,研究 人员的精力主要放在如何手工设计具有尺度、视点、光照W及类内差异等等不变性的图像 特征。但是手工设计图像特征,需要研究人员具有非常专业的领域知识,挑战性很强。因 此,像尺度不变性特征转换(SIFT,Scale-invariantFea1:ureTransformation)、方向梯度 直方图(HOG,HistogramofOrientedGradients)、局部二进制模式(LBP,LocalBinary 化ttern)等鲁椿性较好的图像特征非常稀少,通常每5到10年才能设计出一项较好的手工 特征。此外,手工设计的特征通常在某些视觉任务中表现出色,但在另外一些任务中却表现 一般,例如LBP在人脸识别领域赢得了广泛的声誉,而HOG主要是因为行人检测而出名。 近年来的研究热点一直关注于如何从数据中直接学习得到特征表示。广受关注的 是卷积神经网络模型(CNN,ConvolutionalNeuralNetwork),大规模视觉识别挑战赛中图 像分类比赛的冠军都是基于的模型。 图1所示为一个卷积神经网络的结构示意图,通过对局部感受野进行一系列 的卷积,池化等操作,得到图像的特征表示。在图像特征进行池化之后,需要将池化后的图 像特征与标注的图像样本进行比对,根据比对结果进行误差反传,逐渐调整优化模型参数, 最终理想的图像特征。CNN在训练过程中需要大量有标注的数据样本,例如,ImageNet大规 模视觉识别挑战赛中的训练图片有超过一百万张,整个ImageNet数据集有超过一千万张 的标注图片数据。尽管如此,对于训练一个超大的模型来说,标注数据量仍显得不足。 更加不用说标注一个超大规模的数据集所需要耗费的人力、财力。因此,研究如何从海量的 无标注信息的数据当中无监督式的学习(unsupervisedlearning)得到判别性较强的特 征,显得更加有意义一些,也历来就是学术界研究的热点。 在实际应用中,训练一个大规模的模型同时其训练结果具有良好的性能并不 是一件容易的事情,因为的训练严重依赖已标注的大数据训练样本,虽然ImageNet已 经有众多的标注样本,但是对于实际生活中的数据来说还远远不够。互联网上每天都会有 海量的图片、视频数据上传,难W对海量新增的图片样本进行标注。
技术实现思路
本专利技术实施例提供了一种图像特征提取方法及装置,用于在无监督图像训练过程 中进行高效的图像特征提取。 本专利技术实施例第一方面提供的图像特征提取方法,包括: 对输入图像的待提取像素所在的图像区域内的区域像素进行稀疏编码,从而得到 所述区域像素的M维的编码系数,M为大于0的整数; 根据所述区域像素的编码系数,获得所述图像区域对应的M个稀疏编码图,其中, 所述M个稀疏编码图中的第k个稀疏编码图中任意坐标点的值为所述任意坐标点对应在所 述图像区域内的像素的编码系数在第k个维度下的值,k为小于等于M的正整数; 分别对所述M个稀疏编码图进行池化处理,从而得到所述待提取像素的M维的池 化特征,所述M个稀疏编码图与所述池化特征的M个维度一一对应; 对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特 征的约减特征,所述约减特征的维度小于所述池化特征的维度。 结合第一方面,在第一种可能的实现方式中,所述对输入图像的待提取像素所在 的图像区域内的区域像素进行稀疏编码,从而得到所述区域像素的M维的编码系数包括: 对所述区域像素对应的像素样本进行稀疏编码,从而得到所述区域像素的M维的 编码系数; 其中,根据W下公式求取所述区域像素的编码系数;【主权项】1. 一种图像特征提取方法,其特征在于,包括: 对输入图像的待提取像素所在的图像区域内的区域像素进行稀疏编码,从而得到所述 区域像素的M维的编码系数,M为大于O的整数; 根据所述区域像素的编码系数,获得所述图像区域对应的M个稀疏编码图,其中,所述 M个稀疏编码图中的第k个稀疏编码图中任意坐标点的值为所述任意坐标点对应在所述图 像区域内的像素的编码系数在第k个维度下的值,k为小于等于M的正整数; 分别对所述M个稀疏编码图进行池化处理,从而得到所述待提取像素的M维的池化特 征,所述M个稀疏编码图与所述池化特征的M个维度一一对应; 对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的 约减特征,所述约减特征的维度小于所述池化特征的维度。2. 根据权利要求1所述的方法,其特征在于,所述对输入图像的待提取像素所在的图 像区域内的区域像素进行稀疏编码,从而得到所述区域像素的M维的编码系数包括: 对所述区域像素对应的像素样本进行稀疏编码,从而得到所述区域像素的M维的编码 系数; I中·枏抿W下公式龙取所沭叹城像素的编码紊数;所述是由所述区域像素对应的像素样本中的坐标点的值所列化的列向量,(i,j)为 所述区域像素的坐标,所述K为稀疏函数的稀疏度,所述为所述 区域像素的编码系数,所述Z为所述的字典。3. 根据权利要求1或2所述的方法,其特征在于,所述分别对所述M个稀疏编码图进行 池化处理,从而得到所述M维的池化特征,包括: 根据以下公式求取所述M维的池化特征;所述表示所述池化特征,N(i,j)表示所述稀疏编码图相对于所述输入图像所在的 坐标区域,所述P,q e N(i,j)表示坐标(p,q)在所述坐标区域之内,所述为对应的空间 坐标为(P,q)的编码系数在第1维度下的值,所述<为对应的空间坐标为(p,q)的编码系 数在第M维度下的值。4. 根据权利要求1至3任一项所述的方法,其特征在于,对所述池化特征进行维度约 减,从而得到用于表示所述池化特征的约减特征,包括: 根据以下公式得到用于维度约减的编码器对应的函数f,利用函数f对所述池化特征 进行维度约减,从而得到用于表示所述池化特征的约减特征;其中,g表示用于将所述约减特征恢复为所述池化特征的解码器的函数,η表示所述池 化特征。5. 根据权利要求1至3任一项所述的方法,其特征在于,在所述对所述池化特征进行维 度约减之前,还包括: 对所述M维的池化特征进行归一化处理。6. 当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种图像特征提取方法,其特征在于,包括:对输入图像的待提取像素所在的图像区域内的区域像素进行稀疏编码,从而得到所述区域像素的M维的编码系数,M为大于0的整数;根据所述区域像素的编码系数,获得所述图像区域对应的M个稀疏编码图,其中,所述M个稀疏编码图中的第k个稀疏编码图中任意坐标点的值为所述任意坐标点对应在所述图像区域内的像素的编码系数在第k个维度下的值,k为小于等于M的正整数;分别对所述M个稀疏编码图进行池化处理,从而得到所述待提取像素的M维的池化特征,所述M个稀疏编码图与所述池化特征的M个维度一一对应;对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的约减特征,所述约减特征的维度小于所述池化特征的维度。

【技术特征摘要】

【专利技术属性】
技术研发人员:张世周龚怡宏柴振华
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1