一种融合空间信息的Bag of Words图像检索方法技术

技术编号：6116037 阅读：335 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种融合空间信息的Bag?of?Words图像检索方法，技术特征在于：考虑到图像所包含的内容都是现实世界的物体，物体都具有一定的形状和结构特征，融入显著特征区域的空间信息便可以更加形象、准确的描述图像所包含的内容，从而能够得到更好的图像检索效果。利用Bag?of?Words对图像进行很好的描述，可以获得图像在图像空间基上的向量表示，通过特征区域空间信息的加入，可以很好的保证了图像底层特征区域之间的结构信息，从而提高了图像的检索精度。因此，融合特征区域空间信息的Bag?of?Words图像检索方法，更加适用于图像的检索。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及，可以应用于可见光图像的检索。
技术介绍
随着多媒体信息技术的发展，多媒体信息的存储、压缩和检索变的日益重要。图像作为一种重要的多媒体信息，其包含的内容丰富，正如“一幅图胜过千言”。由于图像底层 SIFT特征的出现，该特征能够很好的反映图像中一些旋转和尺度不变形的显著区域。最近出现了许多基于SIFT特征的图像检索的方法，其中最常见的是Bag of Words方法，该方法首先是对图像所提取的SIFT特征的区域进行聚类，将聚类中心做为图像空间中的一组标准基(标准的图像区域)，然后图像可以用这组标准基进行向量表示，结合现有的文本检索技术，最终实现了图像的检索。现有的Bag of Words方法，仅仅考虑了图像是否含有某些显著的特征区域，而忽略了特征区域的空间信息，因此基于Bag of Words方法图像检索会造成检索精度较低的问题，必须针对如何引入特征区域的空间信息进行新的图像检索方法研究。
技术实现思路
要解决的技术问题为了避免现有技术的不足之处，本专利技术提出一种融合空间信息的Bag of Words图像检索方法。本专利技术的思想在于Bag of Words方法实现了图像在图像空间一组基上的向量表示的同时往往忽略其显著特征区域的空间信息。但是考虑到图像所包含的内容都是现实世界的物体，物体都具有一定的形状和结构特征，融入显著特征区域的空间信息便可以更加形象、准确的描述图像所包含的内容，从而能够得到更好的图像检索效果。技术方案，其特征在于步骤如下步骤1 提取数据库中每幅图像的SIFT特征，得到每幅图像底层特征的集合I = {p...

【技术保护点】
１．一种融合空间信息的Ｂａｇ　ｏｆ　Ｗｏｒｄｓ图像检索方法，其特征在于步骤如下：步骤１：提取数据库中每幅图像的ＳＩＦＴ特征，得到每幅图像底层特征的集合Ｉ＝｛ｐｍ｜ｍ＝１．．．｜Ｉ｜｝，其中ｐｍ＝（ｆｍ，Ｘｍ，λｍ，θｍ），｜Ｉ｜为图像Ｉ中ＳＩＦＴ特征区域数目，ｆｍ为特征区域１２８维的特征描述向量、Ｘｍ为特征区域中心所在位置、λｍ为特征区域尺度信息、θｍ为特征区域的主方向角度信息；步骤２：利用Ｈｉｅｒａｒｃｈｉｃａｌ　Ｋ－ｍｅａｎｓ聚类算法对图像数据库中的所有图像所提取的特征区域的特征描述向量ｆｍ进行聚类，其中聚类数目Ｋ∈［１００００，１００００００］，得到聚类中心的类别的标号ｗ及聚类的层次树结构Ｔｒｅｅ，形成底层特征ｐ′ｍ＝（ｗｍ，Ｘｍ，λｍ，θｍ），所述的ｗｍ∈ｗ为特征区域所属的聚类中心类别的标号；步骤３：计算图像每个底层特征ｐ′ｍ的和Δθｍｎ＝｜｜θｍ－θｎ｜｜，得到ΔＸｍ＝｛ΔＸｍｎ｜ｎ＝１，２，．．．，｜Ｉ｜，ｎ≠ｍ｝和Δθｍ＝（Δθｍｎ｜ｎ＝１，２，．．．，｜Ｉ｜，ｎ≠ｍ），将［０，２π］等分成数个均匀方向区域，在每个均匀方向区域上，计算Δθｍ中属于该方向区域上的集合Δθ′ｍ...

【技术特征摘要】

【专利技术属性】
技术研发人员：韩军伟，郭雷，刘天明，胡新韬，许明，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：87

全部详细技术资料下载我是这个专利的主人