基于词汇树信息融合与豪斯多夫距离结合的图像检索方法技术

技术编号:15639671 阅读:146 留言:0更新日期:2017-06-16 01:02
本发明专利技术基于词汇树信息融合与豪斯多夫距离结合的图像检索方法属于图像检索技术领域;该方法首先提取待检索图像及图像库SIFT特征,然后生成SIFT描述符直方图和SIFT描述符核密度,再融合SIFT描述符核密度和SIFT描述符直方图,通过改进传统Hausdorff距离度量,最后将改进的Hausdorff距离用于图像匹配;该方法包含了基于SIFT核密度的可扩展词汇树与基于SIFT直方图的可扩展词汇树的信息融合、图像相似度衡量标准中的改进的Hausdorff距离以及信息融合与改进Hausdorff距离相结合的图像检索方法,实验证明,该方法不仅能够提高图像检索准确率,还适用于复杂背景的图像检索。

【技术实现步骤摘要】
基于词汇树信息融合与豪斯多夫距离结合的图像检索方法
本专利技术基于词汇树信息融合与豪斯多夫距离结合的图像检索方法属于图像检索

技术介绍
图像检索方法产生至今,已经形成了三个重要的分支:基于文本的图像检索、基于内容的图像检索和基于语义的图像检索。基于文本的图像检索,是用图像名、图像特征等文本来描述用户的需求,但由于文本表达能力具有局限性,文本标注具有歧义性,因此检索结果往往和用户需求不符;基于语义的图像检索,是在图像视觉特征的基础上,进一步提炼其高级语义表达能力,但这类检索方法的检索过程复杂,而且存在方法体系发展尚不完善的问题;基于内容的图像检索,是以颜色、纹理、形状等作为图像的特征表达,并以此为判断相似性的依据,开展图像检索。如果能够准确提取图像特征,基于内容的图像检索将具有另外两类检索不具有的准确率优势。广大学者也都瞄准该技术优势,开展如何提高提取图像特征的准确性方面的研究,以期进一步提高基于内容的图像检索的准确率。
技术实现思路
针对上述技术需求,本专利技术公开了一种基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,能够有效提高基于内容的图像检索的准确率,此外,该方法能够消除背景信息对图像检索准确率的影响,对于具有复杂背景的图像,检索准确率高的技术优势尤其明显。本专利技术的目的是这样实现的:基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,包括以下步骤:步骤a、提取待检索图像及图像库SIFT特征;步骤b、生成SIFT描述符直方图和SIFT描述符核密度;步骤c、融合SIFT描述符核密度和SIFT描述符直方图;步骤d、改进传统Hausdorff距离度量;步骤e、将改进的Hausdorff距离用于图像匹配。上述基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,步骤a的具体步骤如下:步骤a1:构建待检索图像及图像库高斯差分尺度函数利用不同尺度的高斯函数与图像做卷积运算,构建二维图像的高斯差分尺度函数D(x,y,σ),有:D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)其中,k是尺度比例系数,G(x,y,σ)是尺度可变的高斯函数,I(x,y)是图像,并且有:其中,(x,y)是尺度坐标,σ的大小决定图像平滑的程度;步骤a2:检测高斯差分尺度空间极值点将图像中的每一个采样点都与该采样点相邻的点比较,当某个采样点在高斯差分尺度空间的所有点中是最大值或最小值时,认为该点是图像在该尺度下的一个特征点;步骤a3:除去边缘不稳定的特征点,生成SIFT描述符使用HarrisCorner检测器去除边缘的不稳定特征点,保留稳定的特征点,生成SIFT描述符。上述基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,步骤b的具体步骤如下:步骤b1:通过SIFT描述符的分层聚类来构造可扩展词汇树提取每张图片的SIFT描述符,得到一个集合F={fi},然后对集合F采用K-Means聚类方法进行分层聚类,初始时,在第1层对集合F进行K-Means聚类,把集合F分成k份{Fi|1≤i≤k};以此类推,对新产生的簇集利用K-Means再分成k个簇集,不断地重复上述操作直到深度达到预先设定的L值,构造出可扩展词汇树,共有c=BL个节点组成,其中,B是分支因子,L是深度,c是节点总个数,fi表示图片中某个SIFT描述符,F是描述符集合,Fi是对集合F进行K-Means聚类得到的某个簇集;步骤b2:累计可扩展词汇树中每个节点上的描述符出现的次数,得到SIFT描述符直方图在构造可扩展词汇树中,共有c=BL个节点,对第一个节点上的SIFT描述符出现的次数进行累计,获得基于可扩展词汇树的SIFT描述符直方图,用H=[h1,...,hi,...,hc]表示,其中hi表示第i个节点出现SIFT描述符的次数;步骤b3:对SIFT描述符进行量化,得到SIFT描述符核密度对所有的SIFT描述符进行量化,则每个SIFT描述符fi都对应可扩展词汇树中一条从根节点到叶子节点的量化路径,即对应一组视觉词每一组视觉词都对应它的核密度f(c),得到基于可扩展词汇树的SIFT描述符核密度;其中是一个视觉词,即可扩展词汇树中的每个节点都代表一个视觉词,l表示该节点在可扩展词汇树中所在的层数,hl表示该节点在该层树节点中的索引,L是深度。上述基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,步骤c的具体步骤如下:步骤c1:得到SIFT描述符直方图和SIFT描述符核密度的基本概率分配函数为了计算方便,将SIFT描述符直方图设为A,SIFT描述符核密度设为B,则辨别框Ω:{A,B},辨别框是描述构成整个假设空间所有元素的集合,用基本概率分配函数考虑到所有的可能结果,用m()表示;此时,子集A的基本概率分配函数为子集B的基本概率分配函数为其中,M为归一化常数,m1(Ai)表示焦元为Ai的基本概率赋值,m2(Bj)表示焦元为Bj的基本概率赋值;步骤c2:应用Dempster组合规则结合步骤c1得到融合结果Dempster组合规则为:将步骤c1得到结果m(A)和m(B)代入得到m(AB);其中,M为归一化常数,M=∑A∩B=φ(m(A)m(B))=1-∑A∩B≠φ(m(A)m(B))m(A)表示子集A的基本概率分配函数,m(B)表示子集B的基本概率分配函数,m(AB)表示子集A和子集B融合的基本概率分配函数。上述基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,步骤d的具体步骤如下:步骤d1:写出成本函数的微分方程形式成本函数的微分方程形式如下:步骤d2:得到成本函数的通解解微分方程,得到成本函数的表达式为如下:其中γ0是成本函数初始值,它的范围为0~1,k是比例系数,τ是匹配参数;步骤d3:用传统的Hausdorff距离作为成本函数的变量,改进的Hausdorff距离给定两个有限集合X={x1,x2,...,xM}和Y={y1,y2,...,yN},则X和Y之间传统的Hausdorff距离定义为其中,d(X,Y)是传统的Hausdorff距离,min表示最小值,max表示最大值,x和y分别是点集X和Y中的点,d(x,y)表示点x和点y之间的几何距离;改进的Hausdorff距离为:其中|X|是有限集合X的个数,dH(X,Y)是改进的Hausdorff距离,d(X,Y)是传统的Hausdorff距离,γ(d(X,Y))是变量为d(X,Y)的成本函数。上述基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,步骤e的具体步骤如下:根据步骤c得到的融合特征,用改进的Hausdorff距离进行图像的相似度测量,将得到的相似度按照降序排列,得出检索结果。有益效果:本专利技术采用了如下技术手段,首先提取待检索图像及图像库SIFT特征,然后生成SIFT描述符直方图和SIFT描述符核密度,再融合SIFT描述符核密度和SIFT描述符直方图,通过改进传统Hausdorff距离度量,最后将改进的Hausdorff距离用于图像匹配;该技术手段相互依存,缺一不可,作为一个整体,共同实现了其中任何一个手段存在时都不能实现的有效提高基于内容的图像检索准确率的技术目的,此外,本专利技术方法还能够消除背景信息对图像检索准确率的影响,对于具有复杂背景的图像,检索准确率高的技术优势更加明显。附图本文档来自技高网...
基于词汇树信息融合与豪斯多夫距离结合的图像检索方法

【技术保护点】
基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,包括以下步骤:步骤a、提取待检索图像及图像库SIFT特征;步骤b、生成SIFT描述符直方图和SIFT描述符核密度;步骤c、融合SIFT描述符核密度和SIFT描述符直方图;步骤d、改进传统Hausdorff距离度量;步骤e、将改进的Hausdorff距离用于图像匹配。

【技术特征摘要】
1.基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,包括以下步骤:步骤a、提取待检索图像及图像库SIFT特征;步骤b、生成SIFT描述符直方图和SIFT描述符核密度;步骤c、融合SIFT描述符核密度和SIFT描述符直方图;步骤d、改进传统Hausdorff距离度量;步骤e、将改进的Hausdorff距离用于图像匹配。2.根据权利要求1所述的基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,步骤a的具体步骤如下:步骤a1:构建待检索图像及图像库高斯差分尺度函数利用不同尺度的高斯函数与图像做卷积运算,构建二维图像的高斯差分尺度函数D(x,y,σ),有:D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)其中,k是尺度比例系数,G(x,y,σ)是尺度可变的高斯函数,I(x,y)是图像,并且有:其中,(x,y)是尺度坐标,σ的大小决定图像平滑的程度;步骤a2:检测高斯差分尺度空间极值点将图像中的每一个采样点都与该采样点相邻的点比较,当某个采样点在高斯差分尺度空间的所有点中是最大值或最小值时,认为该点是图像在该尺度下的一个特征点;步骤a3:除去边缘不稳定的特征点,生成SIFT描述符使用HarrisCorner检测器去除边缘的不稳定特征点,保留稳定的特征点,生成SIFT描述符。3.根据权利要求1所述的基于词汇树信息融合与豪斯多夫距离结合的图像检索方法,其特征在于,步骤b的具体步骤如下:步骤b1:通过SIFT描述符的分层聚类来构造可扩展词汇树提取每张图片的SIFT描述符,得到一个集合F={fi},然后对集合F采用K-Means聚类方法进行分层聚类,初始时,在第1层对集合F进行K-Means聚类,把集合F分成k份{Fi|1≤i≤k};以此类推,对新产生的簇集利用K-Means再分成k个簇集,不断地重复上述操作直到深度达到预先设定的L值,构造出可扩展词汇树,共有c=BL个节点组成,其中,B是分支因子,L是深度,c是节点总个数,fi表示图片中某个SIFT描述符,F是描述符集合,Fi是对集合F进行K-Means聚类得到的某个簇集;步骤b2:累计可扩展词汇树中每个节点上的描述符出现的次数,得到SIFT描述符直方图在构造可扩展词汇树中,共有c=BL个节点,对第一个节点上的SIFT描述符出现的次数进行累计,获得基于可扩展词汇树的SIFT描述符直方图,用H=[h1,...,hi,...,hc]表示,其中hi表示第i个节点出现SIFT描述符的次数;步骤b3:对SIFT描述符进行量化,得到SIFT描述符核密度对所有的SIFT描述符进行量化,则每个SIFT描述符fi都对应可扩展词汇树中一条从根节点到叶子节点的量化路径,即对应一组视觉词每一组视觉词都对应它的核密度f(c),得到基于可扩展词汇树的SIFT描述符核密度;其中是一个视觉词,即可扩展词汇树中的每个节点...

【专利技术属性】
技术研发人员:孙晓明张宁车畅刘野吴海滨
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1