当前位置: 首页 > 专利查询>天津中科智能识别产业技术研究院有限公司专利>正文

一种基于矩阵分解的部分标注图像聚类方法及装置制造方法及图纸

技术编号：13284435 阅读：145 留言：0更新日期：2016-07-09 01:17

本发明专利技术公开一种基于矩阵分解的部分标注图像聚类方法及装置，该方法包括：提取图像及图像标注词的特征；基于字典学习得到图像稀疏表达；对观测的图像标注词特征矩阵分解获得图像标注词的隐变量表达，以保持图像稀疏表达和图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性；结合图像字典学习与部分观测的标注词矩阵分解构建目标函数；优化目标函数学习图像稀疏表达；基于学习到的稀疏表达进行图像聚类。本发明专利技术可学习图像完整的稀疏表达及所有图像标注词的隐变量表达,通过图像与图像标注词间共生关系建立上述表达间联系,从而利用标注词所携带的高层语义信息辅助图像特征学习,通过携带有高层语义信息的图像特征以提升图像聚类性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于矩阵分解的部分标注图像聚类方法及装置
本专利技术涉及模式识别
，尤其是一种基于矩阵分解的部分标注图像聚类方法及装置。
技术介绍
随着图片分享网站如Flickr的迅速发展，互联网上存在着数以亿计的图片信息，如何对这些图片信息进行组织受到越来越多的关注。聚类技术作为一种有效数据组织方式，在图像组织中起着重要的作用。传统的图像聚类技术一般提取图像本身局部特征(如SIFT特征)或者全局特征(如GIST特征)以实现图像聚类。然而，近些年来，随着图像标注信息的快速增长，如越来越多的用户在Flickr网站上对自己分享的图片进行标注，如何利用标注这一高层语义信息来辅助图像聚类受到越来越多的关注。为利用标注信息辅助图像聚类，研究者提出了一系列的技术手段，如层次聚类(hierarchicalclustering)、联合聚类(co-clustering)以及多视角聚类(Multi-viewclustering)。然而上述方法一般假设图像具有完整的标注词特征，即每一副图像都有完整的标注词进行描述，这在现实中是难以满足的，比如用户一般仅对部分图像进行标注，或者在图像标注时仅仅给出一部分的标注词。在上述场景中，标注信息是不完整的，使得传统的利用标注信息辅助图像聚类的方法面临着较大的性能下降。因此，需要提出有效的算法实现部分标注图像聚类任务。
技术实现思路
本专利技术的目的在于解决上述技术问题而提供一种基于矩阵分解的部分标注图像聚类方法及装置，以解决现有方法不能有效地满足部分标注图像聚类的需求的技术问题。本专利技术是这样实现的，一种基于矩阵分解的部分标注图像聚类方法，包括步骤...

【技术保护点】
一种基于矩阵分解的部分标注图像聚类方法，其特征在于，包括：提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征；基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达；对观测到的图像标注词的特征进行矩阵分解，学习得到图像标注词的隐变量表达，并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性；结合图像字典学习与所述矩阵分解构建优化目标函数；采用交替优化方式求解所述优化目标函数，得到所有图像最终的稀疏表达；基于所述稀疏表达利用kmeans聚类算法得到预设类别的图像聚类。

【技术特征摘要】
1.基于矩阵分解的部分标注图像聚类方法，其特征在于，包括：提取聚类数据集中图像的特征以及反映图像标注词是否存在于图像中的图像标注词的特征；基于图像字典学习获得所述聚类数据集中所有图像的稀疏表达；对观测到的图像标注词的特征进行矩阵分解，学习得到图像标注词的隐变量表达，并保持所述图像的稀疏表达和所述图像标注词的隐变量表达与图像和图像标注词的共生关系的一致性；结合图像字典学习与所述矩阵分解构建优化目标函数；所述优化目标函数表示为：其中，X为图像的特征；D为学习得到的图像字典；S为所有图像的稀疏表达构成的矩阵，si为S的第i列、对应图像i的稀疏表达；I为权重矩阵，以对图像是否存在图像标注词进行权重设定；T为图像标注词特征，R是学习得到的图像标注词的隐变量表达，ri为R的第i行、对应图像标注词i的隐变量表达，γ1和γ2为预设比例系数；采用交替优化方式求解所述优化目标函数，得到所有图像最终的稀疏表达；基于所述稀疏表达利用kmeans聚类算法得到预设类别的图像聚类。2.根据权利要求1所述基于矩阵分解的部分标注图像聚类方法，其特征在于，所述聚类数据集中的所述图像中，部分图像具有完整的图像标注词，部分图像没有图像标注词或者仅有不完整的图像标注词。3.根据权利要求1或2所述基于矩阵分解的部分标注图像聚类方法，其特征在于，所述图像的特征是指视觉描述算子，所述图像标注词的特征由0和1组成。4.根据权利要求3所述基于矩阵分解的部分标注图像聚类方法，其特征在于，所述视觉描述算子包括图像的局部特征和\或者全局特征。5.矩阵分解的部分标注图像聚类装置，其特征在于，包括：特征提取模块...

【专利技术属性】
技术研发人员：王亮，吴书，尹奇跃，
申请(专利权)人：天津中科智能识别产业技术研究院有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人