一种基于矩阵分解的部分标注图像聚类方法及装置制造方法及图纸

技术编号:13284435 阅读:145 留言:0更新日期:2016-07-09 01:17
本发明专利技术公开一种基于矩阵分解的部分标注图像聚类方法及装置,该方法包括:提取图像及图像标注词的特征;基于字典学习得到图像稀疏表达;对观测的图像标注词特征矩阵分解获得图像标注词的隐变量表达,以保持图像稀疏表达和图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;结合图像字典学习与部分观测的标注词矩阵分解构建目标函数;优化目标函数学习图像稀疏表达;基于学习到的稀疏表达进行图像聚类。本发明专利技术可学习图像完整的稀疏表达及所有图像标注词的隐变量表达,通过图像与图像标注词间共生关系建立上述表达间联系,从而利用标注词所携带的高层语义信息辅助图像特征学习,通过携带有高层语义信息的图像特征以提升图像聚类性能。

【技术实现步骤摘要】
一种基于矩阵分解的部分标注图像聚类方法及装置
本专利技术涉及模式识别
,尤其是一种基于矩阵分解的部分标注图像聚类方法及装置。
技术介绍
随着图片分享网站如Flickr的迅速发展,互联网上存在着数以亿计的图片信息,如何对这些图片信息进行组织受到越来越多的关注。聚类技术作为一种有效数据组织方式,在图像组织中起着重要的作用。传统的图像聚类技术一般提取图像本身局部特征(如SIFT特征)或者全局特征(如GIST特征)以实现图像聚类。然而,近些年来,随着图像标注信息的快速增长,如越来越多的用户在Flickr网站上对自己分享的图片进行标注,如何利用标注这一高层语义信息来辅助图像聚类受到越来越多的关注。为利用标注信息辅助图像聚类,研究者提出了一系列的技术手段,如层次聚类(hierarchicalclustering)、联合聚类(co-clustering)以及多视角聚类(Multi-viewclustering)。然而上述方法一般假设图像具有完整的标注词特征,即每一副图像都有完整的标注词进行描述,这在现实中是难以满足的,比如用户一般仅对部分图像进行标注,或者在图像标注时仅仅给出一部分的标注词。在上述场景中,标注信息是不完整的,使得传统的利用标注信息辅助图像聚类的方法面临着较大的性能下降。因此,需要提出有效的算法实现部分标注图像聚类任务。
技术实现思路
本专利技术的目的在于解决上述技术问题而提供一种基于矩阵分解的部分标注图像聚类方法及装置,以解决现有方法不能有效地满足部分标注图像聚类的需求的技术问题。本专利技术是这样实现的,一种基于矩阵分解的部分标注图像聚类方法,包括步骤:提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;结合图像字典学习与所述矩阵分解构建优化目标函数;采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;基于所述稀疏表达利用聚类算法得到预设类别的图像聚类。本专利技术的目的还在于提供一种基于矩阵分解的部分标注图像聚类装置,包括:特征提取模块,用于提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;图像稀疏表达获得模块,用于基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;标注词隐变量表达获得模块,用于对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;优化目标函数构建模块,用于结合图像字典学习与所述矩阵分解构建优化目标函数;最终稀疏表达形成模块,用于采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;图像聚类模块,用于基于所述稀疏表达利用聚类算法得到预设类别的图像聚类。本专利技术图像聚类的方法以及装置,基于字典学习的方法,学习得到图像数据集中每一幅图像的稀疏表达,同时通过对图像的部分观测的图像标注词特征进行矩阵分解,学习得到每一个图像标注词的隐变量表达,最终使图像的稀疏表达与图像标注词的隐变量表达通过图像与图像标注词的共生关系建立连接,保持共生关系的一致性,从而可以利用图像标注词的高层语义信息辅助图像特征的学习进行图像的聚类,获得图像聚类的结果,大大地提升了图像聚类性能。附图说明图1所示为本专利技术提供的基于矩阵分解的部分标注图像聚类方法的流程图;图2是本专利技术提供的基于矩阵分解的部分标注图像聚类方法原理示意图;图3所示为本专利技术提供的基于矩阵分解的部分标注图像聚类装置的结构原理图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。本专利技术通过利用不完整观测的具有高层语义的图像标注词辅助图像稀疏表达的学习,进而使得图像稀疏表达能够融合图像和标注词两方面的信息,从而以利用图像标注词的高层语义信息辅助图像特征的学习,进行图像聚类,获得图像聚类的结果,大大提高了图像聚类的性能。参见图1所示,一种基于矩阵分解的部分标注图像聚类方法,包括步骤:S101:提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;S102:基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;S103:对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;S104:结合图像字典学习与所述矩阵分解构建优化目标函数;S105:采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;S106:基于所述稀疏表达利用kmeans聚类算法得到预设类别的图像聚类。具体实现上,在步骤S106中,基于上述图像的最终的稀疏表达可以是利用kmeans聚类算法得到预设类别的图像聚类,如通过给定聚类数目,将kmeans聚类算法作用于图像的稀疏表达就可以得到最终的图像聚类,获得图像聚类的结果。本专利技术基于字典学习的方法,学习得到图像数据集中每一幅图像的稀疏表达,同时通过对图像的部分观测的图像标注词特征进行矩阵分解,学习得到每一个图像标注词的隐变量表达,最终使图像的稀疏表达与图像标注词的隐变量表达通过图像与图像标注词的共生关系建立连接,从而以利用图像标注词的高层语义信息辅助图像特征的学习,进而能有效地提升图像聚类性能。需要说明的是,本专利技术中,所述聚类数据集中的图像的部分图像包含完整的标注词,部分图像没有标注词或者仅有不完整的标注词;在提取图像的标注词特征时,不但对含完整的标注词的特征进行提取,也对不完整的标注词的特征进行提取。本专利技术中,所述图像的特征一般是视觉描述算子,具体实现上可以是图像的局部特征如SIFT特征,或者图像的全部特征,如GIST特征,所述图像标注词的特征则有0和1组成,以反应标注词是否存在于图像中。具体的,本专利技术中,在步骤S102中,所述所有的图像的稀疏表达建模方式可以为:其中,X为图像的视觉特征,每一列表示一个图像,D为学习得到的图像字典,所设计约束条件作用于矩阵的每一列防止图像字典过拟合。S为所有图像的稀疏表达所构成的矩阵,si为S的第i列,对应图像i的稀疏表达,||si||1定义为si所有元素绝对值之和,该正则项使得所求得的表达具有稀疏特性。本专利技术中,步骤S103中,对图像标注词的特征进行矩阵分解的建模方式可以采用以下:其中,sj为图像j的稀疏表达,O为观测到的图像与标注词关系,即图像j包含标注词i。T为标注词特征,每一列对应一副图像,由0和1组成,反应图像标注词是否存在于该图像中。参见图2所示,如第一列对应第一幅图像,观测到图像标注词t1和t3(T11=T31=1),利用提取的观测到的图像标注词通过部分矩阵分解得到图像稀疏表达与标注词的隐变量表达的关系。利用提取的图像特征通过图像字典学习得到图像的稀疏表达与图像字典。图像标注词的特征和图像的特征通过图像的稀疏表达建立联系。R是学习得到的图像标注词的隐变量表达,ri为R的第i行,对应图像标注词i本文档来自技高网...

【技术保护点】
一种基于矩阵分解的部分标注图像聚类方法,其特征在于,包括:提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;结合图像字典学习与所述矩阵分解构建优化目标函数;采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;基于所述稀疏表达利用kmeans聚类算法得到预设类别的图像聚类。

【技术特征摘要】
1.基于矩阵分解的部分标注图像聚类方法,其特征在于,包括:提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征;基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达;对观测到的图像标注词的特征进行矩阵分解,学习得到图像标注词的隐变量表达,并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性;结合图像字典学习与所述矩阵分解构建优化目标函数;所述优化目标函数表示为:其中,X为图像的特征;D为学习得到的图像字典;S为所有图像的稀疏表达构成的矩阵,si为S的第i列、对应图像i的稀疏表达;I为权重矩阵,以对图像是否存在图像标注词进行权重设定;T为图像标注词特征,R是学习得到的图像标注词的隐变量表达,ri为R的第i行、对应图像标注词i的隐变量表达,γ1和γ2为预设比例系数;采用交替优化方式求解所述优化目标函数,得到所有图像最终的稀疏表达;基于所述稀疏表达利用kmeans聚类算法得到预设类别的图像聚类。2.根据权利要求1所述基于矩阵分解的部分标注图像聚类方法,其特征在于,所述聚类数据集中的所述图像中,部分图像具有完整的图像标注词,部分图像没有图像标注词或者仅有不完整的图像标注词。3.根据权利要求1或2所述基于矩阵分解的部分标注图像聚类方法,其特征在于,所述图像的特征是指视觉描述算子,所述图像标注词的特征由0和1组成。4.根据权利要求3所述基于矩阵分解的部分标注图像聚类方法,其特征在于,所述视觉描述算子包括图像的局部特征和\或者全局特征。5.矩阵分解的部分标注图像聚类装置,其特征在于,包括:特征提取模块...

【专利技术属性】
技术研发人员:王亮吴书尹奇跃
申请(专利权)人:天津中科智能识别产业技术研究院有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1