基于非负矩阵分解的隐含语义图像检索方法技术

技术编号:2857026 阅读:206 留言:0更新日期:2012-04-11 18:40
一种基于非负矩阵分解的隐含语义图像检索方法,利用原型图像库来构建特征-图像矩阵,应用非负矩阵分解训练算法对该矩阵进行矩阵分解,并用分解后得到的基矩阵来构造一个低维的语义空间,而系数矩阵的每一列向量就是原型图像库中每一个图像对应的语义特征。然后用非负矩阵分解测试算法将查询图像投影到这个语义空间来获得语义特征。最后,在这个低维语义空间中,进行所有原型图像的语义特征和查询图像语义特征的相似性度量,并按照相似性的大小将检索图像结果返回给用户。本发明专利技术的方法所建立的图像检索系统,通过非负矩阵分解算法来寻找特征与图像中隐含的语义联系,从而获得较高的检索准确率。

【技术实现步骤摘要】

本专利技术涉及一种,涉及模式识别、矩阵分析和图像检索等领域,能直接应用于基于内容的图像检索。
技术介绍
上个世纪后期,随着大规模图像数据库的不断涌现,对于如此大数据量信息的管理和有效的应用逐渐引起人们的重视,基于内容的图像检索便成为一个热点研究领域。传统的图像检索系统在对图像内容进行描述的时候,大多直接从图像数据中分析抽取底层视觉特征(例如图像的颜色、形状、纹理、空间关系等),而人对图像内容的理解无法直接从图像数据中获得,要根据人的知识来判断。这个过程结合了日常生活中积累的大量经验。刘忠伟等(刘忠伟,章毓晋,基于特征的图象查询和检索系统,应用基础及工程学学报2000.8(1)69-77)探讨了利用颜色、纹理、形状等单一特征以及综合利用不同特征的查询和检索方法。但由于使用的特征都是底层的视觉特征,它们无法反应这些经验知识,因此在传统的底层视觉特征基础上的图像检索并不能取得良好的效果。这样实现底层视觉特征和高层语义之间的映射就成为解决这一问题的关键,但是事实上语义的概念和底层的视觉特征并不是一一对应的关系,也就是说相似的底层特征可能代表不一样的语义概念,而不同的底层特征却可能对应相似的语义内容,这就是基于内容的图像检索中存在的多义性和同义性问题。在文本检索中存在着类似的问题,例如相似的单词会有不同的意思,而相似的语义却会有不同的单词来表达。文本检索中运用隐含语义索引(LatentSemantic Indexing,LSI)技术来解决这个问题(周文,龚礼明,蒋岚,隐含语义检索及中文样本分析实例,计算机应用,2004.24(6)273-276)。它通过对词频—文档矩阵运用奇异值分解(Singular Value Decomposition,SVD)米建立单词文档间的联系模型,从而发现单词与文档之间隐含的语义联系,提高了系统的检索性能。当这一技术应用在图像检索中,通过奇异值分解可以将特征—图像矩阵分解得到一个低维的线性空间,建立特征和图像间的联系,从而发现底层特征与图像内容之间隐含的语义联系。但是在用奇异值分解得到的矩阵中即包含有正值分量也有负值分量,它所表示的却是特征出现的频率(如同文本检索中的词频),这样负值分量就无法进行合理的解释。此外在一个给定的维数下,奇异值分解能够保持良好近似的前提条件是样本分布服从正态分布,但是这种假设对于图像检索中特征出现的频率常常是无法满足的,泊松或者其他非负性的分布更为适合。
技术实现思路
本专利技术的目的在于针对上述基于奇异值分解的隐含语义索引方法的不足,提出一种基于非负矩阵分解(Non-negative Matrix Factorization)的隐含语义图像检索方法,提高图像检索的精度。为实现这一目的,本专利技术利用原型图像库来构建特征—图像矩阵,首先应用非负矩阵分解训练算法对该矩阵进行矩阵分解,并用分解后得到的基矩阵来构造一个低维的语义空间,而系数矩阵的每一列向量就是原型图像库中每一个图像对应的语义特征。然后用非负矩阵分解测试算法将查询图像投影到这个语义空间来获得语义特征。最后,在这个低维语义空间中,进行所有原型图像的语义特征和查询图像语义特征的相似性度量,并按照相似性的大小将检索图像结果返回给用户。本专利技术的按如下步骤进行1.构造特征—图像矩阵首先将原型图像库中的每一个图像都提取色度—饱和度混合直方图特征,然后构造特征—图像矩阵,该矩阵的每一列对应于一个图像,每一行对应于色度—饱和度混合直方图特征的一个分量。2.构造语义空间并生成原型图像的语义特征应用非负矩阵分解训练算法对特征—图像矩阵进行分解得到基矩阵和系数矩阵,用该基矩阵的基向量构造一个低维的语义空间。语义空间的维数r的取值要满足(n+m)r<nm,此处n代表色度—饱和度混合直方图特征的维数,m代表原型图像的个数。此时分解得到的系数矩阵是原型图像在此语义空间的投影,所以可以看作是原型图像的语义特征。3.查询图像语义特征的生成对于查询图像,首先提取色度—饱和度混合直方图特征颜色直方图特征,然后运用非负矩阵分解测试算法将查询图像的底层特征投影到第二步得到的语义空间中,从而得到该查询图像的语义特征。4.相似性度量及结果返回通过前面的步骤,已经得到每个原型图像的语义特征和查询图像的语义特征。最后计算查询图像和数据库每一个原型图像的语义特征的相似性,按照相似性的大小进行排序,将与检索图像最相似的若干幅图像返回。本专利技术的方法能够获得较高的检索准确率。由于基于非负矩阵分解的隐含语义索引方法可以将特征—图像矩阵分解得到一个低维的语义空间,建立了特征和图像间的联系,能够发现底层特征与图像内容之间隐含的语义联系。在一些直接用底层视觉特征直接检索效果不好的应用中,本专利技术的方法更具有使用价值。本专利技术建立的基于非负矩阵分解的隐含语义图像检索系统,可以用于基于图像内容和语义的检索,能较准确的检索出用户需要的图像。附图说明图1为本专利技术中用非负矩阵分解训练算法分解特征—图像矩阵得到基矩阵和系数矩阵示意图。图2为本专利技术实施例的查询图像和检索结果示意图。具体实施例方式以下结合具体的实施例对本专利技术的技术方案作进一步的详细描述。本专利技术实施例采用的图像数据库共有500个样本,储存有从网络收集的各种语义类别的图像,包括室外风景、植物、汽车、动物、室内风景、人造建筑等。底层视觉特征采用色度—饱和度混合直方图特征。特征用向量表示,T={x→l}.]]>(l=1,2,...,500),x→l={xl1,xl2,···,xlp,···,xl100}]]>含100个特征。每次返回和查询图像最相似的12个图像。整个系统实现过程如下1.构造特征—图像矩阵首先将原型图像库中的每一个图像都提取色度—饱和度混合直方图特征,然后构造特征—图像矩阵VP,其大小为100×500,其中100是色度—饱和度混合直方图特征的维数,500是原型图像的个数。2.构造语义空间并生成原型图像的语义特征用非负矩阵分解训练算法将特征—图像矩阵VP分解为基矩阵WP和系数矩阵HP。这里低维空间的维数设为r,则基矩阵和系数矩阵的大小分别为100×r和r×500。其中WP的每一列包含一个基向量,根据非负矩阵分解算法的性质,WP中的所有基向量就构造了一个语义空间,而HP的每一列可以看成是VP中每个图像在该语义空间的特征。设第j个图像的n维颜色直方图特征为VjP={Vj1P,Vj2P,···VjnP}T,]]>那么相应的系数向量为HjP={Hj1P,Pj2P,···,HjrP}T,]]>就是第j个原型图像的语义特征。图1中给出了该步骤的示意图。在图1中,可以看到特征—图像矩阵V被分解为基矩阵W和系数矩阵H。特征—图像矩阵中每个样本都表示为n维的底层特征向量,如灰色部分表明第j个图像样本。而在系数矩本文档来自技高网
...

【技术保护点】
一种基于非负矩阵分解的隐含语义图像检索方法,其特征在于包括如下具体步骤:1)构造特征-图像矩阵:首先将原型图像库中的每一个图像都提取色度-饱和度混合直方图特征,然后构造特征-图像矩阵,该矩阵的每一列对应于一个图像,每一行对应于色度- 饱和度混合直方图特征的一个分量;2)构造语义空间并生成原型图像的语义特征:应用非负矩阵分解训练算法对特征-图像矩阵进行分解得到基矩阵和系数矩阵,则用该基矩阵构造一个低维的语义空间,语义空间的维数r的取值要满足(n+m)r<nm,其中 n代表色度-饱和度混合直方图特征的维数,m代表原型图像的个数,此时分解得到的系数矩阵是原型图像在此语义空间的投影,可以看作是原型图像的语义特征;3)查询图像语义特征的生成:对于查询图像,首先提取色度-饱和度混合直方图特征颜色直方图特 征,然后运用非负矩阵分解测试算法将查询图像的底层特征投影到前面得到的语义空间中,从而得到该查询图像的语义特征;4)相似性度量及结果返回:根据得到的每个原型图像的语义特征和查询图像的语义特征,计算查询图像和数据库每一个原型图像的语义特 征的相似性,并按照相似性的大小进行排序,将与检索图像最相似的若干幅图像返回。...

【技术特征摘要】

【专利技术属性】
技术研发人员:梁栋杨杰姚莉秀常宇畴
申请(专利权)人:上海交通大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1