一种融合空间信息的Bag of Words图像检索方法技术

技术编号:6116037 阅读:335 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种融合空间信息的Bag?of?Words图像检索方法,技术特征在于:考虑到图像所包含的内容都是现实世界的物体,物体都具有一定的形状和结构特征,融入显著特征区域的空间信息便可以更加形象、准确的描述图像所包含的内容,从而能够得到更好的图像检索效果。利用Bag?of?Words对图像进行很好的描述,可以获得图像在图像空间基上的向量表示,通过特征区域空间信息的加入,可以很好的保证了图像底层特征区域之间的结构信息,从而提高了图像的检索精度。因此,融合特征区域空间信息的Bag?of?Words图像检索方法,更加适用于图像的检索。

【技术实现步骤摘要】

本专利技术涉及,可以应用于可见光 图像的检索。
技术介绍
随着多媒体信息技术的发展,多媒体信息的存储、压缩和检索变的日益重要。图像 作为一种重要的多媒体信息,其包含的内容丰富,正如“一幅图胜过千言”。由于图像底层 SIFT特征的出现,该特征能够很好的反映图像中一些旋转和尺度不变形的显著区域。最近 出现了许多基于SIFT特征的图像检索的方法,其中最常见的是Bag of Words方法,该方法 首先是对图像所提取的SIFT特征的区域进行聚类,将聚类中心做为图像空间中的一组标 准基(标准的图像区域),然后图像可以用这组标准基进行向量表示,结合现有的文本检索 技术,最终实现了图像的检索。现有的Bag of Words方法,仅仅考虑了图像是否含有某些显著的特征区域,而忽 略了特征区域的空间信息,因此基于Bag of Words方法图像检索会造成检索精度较低的问 题,必须针对如何引入特征区域的空间信息进行新的图像检索方法研究。
技术实现思路
要解决的技术问题为了避免现有技术的不足之处,本专利技术提出一种融合空间信息的Bag of Words图 像检索方法。本专利技术的思想在于Bag of Words方法实现了图像在图像空间一组基上的向量表 示的同时往往忽略其显著特征区域的空间信息。但是考虑到图像所包含的内容都是现实世 界的物体,物体都具有一定的形状和结构特征,融入显著特征区域的空间信息便可以更加 形象、准确的描述图像所包含的内容,从而能够得到更好的图像检索效果。技术方案,其特征在于步骤如下步骤1 提取数据库中每幅图像的SIFT特征,得到每幅图像底层特征的集合I = {pjm= 1... |1|},其中Pm= (fm, Xm, λω, θω), |l|为图像I中SIFT特征区域数目,乙为 特征区域1 维的特征描述向量、Xffl为特征区域中心所在位置、λ m为特征区域尺度信息、 θ m为特征区域的主方向角度信息;步骤2 利用Hierarchical K-means聚类算法对图像数据库中的所有图像所提取 的特征区域的特征描述向量fm进行聚类,其中聚类数目Ke ,得到聚类中 心的类别的标号w及聚类的层次树结构Tree,形成底层特征p' ffl = (wffl, Xffl, λ ω, θω),所述 的^ e w为特征区域所属的聚类中心类别的标号;步骤3:计算图像每个底层特征权利要求1. ,其特征在于步骤如下 步骤1 提取数据库中每幅图像的SIFT特征,得到每幅图像底层特征的集合I = {pJm =1... 11},其中Pm= (fm,Xm,λω, θω), |l|为图像I中SIFT特征区域数目,乙为特征区 域1 维的特征描述向量、Xm为特征区域中心所在位置、λ m为特征区域尺度信息、θ m为特 征区域的主方向角度信息;步骤2 利用Hierarchical K-means聚类算法对图像数据库中的所有图像所提取的特 征区域的特征描述向量4进行聚类,其中聚类数目Ke ,得到聚类中心的 类别的标号w及聚类的层次树结构"Tree,形成底层特征P' ffl = (wffl, Xffl, λ m,θω),所述的 wfflew为特征区域所属的聚类中心类别的标号;步骤3:计算图像每个底层特征p' JAZnm=丨丨 丨丨、和Δ θωη = U θω-θη||,得到 AXm = (AXmJn = 1,2, ... , 111,η 乒 m}和 Δ 0m = (Δ θ Jn = 1,2, ... , | |, η兴m),将W,2 π ]等分成数个均勻方向区域,在每个均勻方向区域上,计算Δ θ m中属于该 方向区域上的集合Δ θ' m= {Δ 0mi|i = ,...,aJ所对应的集合ΔΧ' m= {AXmi|i =ai; . . . , aj中最小值对应的特征区域的类别标号&,其中Δθ^ C=Aem,ΔΧ: c AXm, ▽。€{1,2,...,|/|},7‘£{1,2,...,幻,得到底层特征?〃 m= (wffl, swffl);所述的下标mn分别表示 图像中第m个特征区域与第η个特征区域,所述的Swm为数个均勻方向区域上选取的Wi组 成的向量;步骤4:图像数据库中的每幅图像T的底层特征的集合表示t= {p〃 Jm= 1, 2, ... T|},其中 ρ" m= (wm, swm);步骤5:计算待查询图像目标区域Q的底层特征的集合q= {p〃。|o= 1,2,... |Q|}, 其中ρ"。=( 。,1。),待查询图像目标区域特征?,?',P"均以下标0表示,与图像数据 库中下标m加以区分,具体步骤如下步骤a:提取以待查询图像目标区域的底层SIFT特征,得到以待查询图像目标区域Q 的底层特征集合 q= {p0|o = 1.. . |Q|},其中 ρ。= (f。,X。,λ。,θ。);步骤b 利用步骤2生成的聚类层次树结构Tree,查找每个f。对应的类别标号w。,得到Jo = 1,2,... |Q|},其中全文摘要本专利技术涉及,技术特征在于考虑到图像所包含的内容都是现实世界的物体,物体都具有一定的形状和结构特征,融入显著特征区域的空间信息便可以更加形象、准确的描述图像所包含的内容,从而能够得到更好的图像检索效果。利用Bag of Words对图像进行很好的描述,可以获得图像在图像空间基上的向量表示,通过特征区域空间信息的加入,可以很好的保证了图像底层特征区域之间的结构信息,从而提高了图像的检索精度。因此,融合特征区域空间信息的Bag of Words图像检索方法,更加适用于图像的检索。文档编号G06F17/30GK102117337SQ20111008133公开日2011年7月6日 申请日期2011年3月31日 优先权日2011年3月31日专利技术者刘天明, 胡新韬, 许明, 郭雷, 韩军伟 申请人:西北工业大学本文档来自技高网...

【技术保护点】
1.一种融合空间信息的Bag of Words图像检索方法,其特征在于步骤如下:步骤1:提取数据库中每幅图像的SIFT特征,得到每幅图像底层特征的集合I={pm|m=1...|I|},其中pm=(fm,Xm,λm,θm),|I|为图像I中SIFT特征区域数目,fm为特征区域128维的特征描述向量、Xm为特征区域中心所在位置、λm为特征区域尺度信息、θm为特征区域的主方向角度信息;步骤2:利用Hierarchical K-means聚类算法对图像数据库中的所有图像所提取的特征区域的特征描述向量fm进行聚类,其中聚类数目K∈[10000,1000000],得到聚类中心的类别的标号w及聚类的层次树结构Tree,形成底层特征p′m=(wm,Xm,λm,θm),所述的wm∈w为特征区域所属的聚类中心类别的标号;步骤3:计算图像每个底层特征p′m的和Δθmn=||θm-θn||,得到ΔXm={ΔXmn|n=1,2,...,|I|,n≠m}和Δθm=(Δθmn|n=1,2,...,|I|,n≠m),将[0,2π]等分成数个均匀方向区域,在每个均匀方向区域上,计算Δθm中属于该方向区域上的集合Δθ′m={Δθmi|i=a1,...,ak}所对应的集合ΔX′m={ΔXmi|i=a1,...,ak}中最小值对应的特征区域的类别标号wi,其中得到底层特征p″m=(wm,swm);所述的下标mn分别表示图像中第m个特征区域与第n个特征区域,所述的swm为数个均匀方向区域上选取的wi组成的向量;步骤4:图像数据库中的每幅图像T的底层特征的集合表示t={p″m|m=1,2,...|T|},其中p″m=(wm,swm);步骤5:计算待查询图像目标区域Q的底层特征的集合q={p″o|o=1,2,...|Q|},其中p″o=(wo,swo),待查询图像目标区域特征p,p′,p″均以下标o表示,与图像数据库中下标m加以区分,具体步骤如下:步骤a:提取以待查询图像目标区域的底层SIFT特征,得到以待查询图像目标区域Q的底层特征集合q={po|o=1...|Q|},其中po=(fo,Xo,λo,θo);步骤b:利用步骤2生成的聚类层次树结构Tree,查找每个fo对应的类别标号wo,得到以待查询图像目标区域Q的底层特征集合q={p′o|o=1,2,...|Q|},其中p′o=(wo,Xo,λo,θo),wo∈w;步骤c:对以待查询图像目标区域q={p′o|o=1,2,...|Q|},分别选取q中的每个底层特征p′o计算和Δθon=||θo-θn||,得到ΔXo={ΔXon|n=1,2,...,|I|,n≠o}和Δθo=(Δθon|n=1,2,...,|I|,n≠o),将[0,2π]等分成数个均匀方向区域,在每个均匀方向区域上,计算Δθo中属于该方向区域上的集合Δθ′o={Δθoi|i=a1,...,ak}所对应的集合ΔX′o={ΔXoi|i=a1,...,ak}中最小值对应的特征区域的类别标号wo,其中得到底层特征po″=(wo,swo);,得到以待查询图像底层特征集合q={p″o|o=1,2,...|Q|},其中p″o=(wo,swo);步骤6:计算以待查询图像目标区域Q与图像数据库中每幅图像T之间的相似度,具体步骤如下:步骤(a):依次取图像数据库中的每幅图像t={p″m|m=1,2,...|T|};步骤(b):对q中的每个元素p″o,判断t中是否存在非空子集mt,使其满足步骤(c):如果存在非空子集mt,则计算swo与mt中每个swm的相似度得到S_temp={S_temp(m)|m∈{s1,s2,....sk}},其中所述的H(·)为汉明距离,所述的D为swo的向量长度;步骤(d):计算以待查询图像目标区域Q与数据库中每幅图像T之间的所述Ss(Q,T)为对每个元素(wo,swo)生成的S_temp进行max(S_temp)求和,所述的Sw(Q,T)为每个元素(wo,swo)生成的S_temp进行max(S_temp)>0数目求和,所述|T|为图像特征区域的数目;步骤7:将以待查询图像目标Q与数据库中每幅图像T之间的S(Q,T)按降序排列,按相似度大小依次在图像库中选取所对应的图像。...

【技术特征摘要】

【专利技术属性】
技术研发人员:韩军伟郭雷刘天明胡新韬许明
申请(专利权)人:西北工业大学
类型:发明
国别省市:87

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1