当前位置: 首页 > 专利查询>江苏大学专利>正文

基于D-S证据理论的视觉词典构建方法技术

技术编号:8683118 阅读:389 留言:0更新日期:2013-05-09 03:05
本发明专利技术公开了一种基于D-S证据理论的视觉词典构建方法,包括:S1、提取所有训练图像的SIFT特征,应用K均值实现初步的视觉字典分类得到K个子类;S2、设定分类阈值t和熵阈值s;S3、判断当前的分类数是否小于t,若是,执行步骤S4,若否,执行步骤S7;S4、对已有分类计算每个子类的信息熵;S5、选择信息熵最大的一个子类作为当前要分解的类,判断该子类的信息熵是否大于s,若是,执行步骤S6,若否,执行步骤S7;S6、将当前信息熵最大的子类h运用D-S证据理论进一步分类;S7、计算新形成的子类的聚类中心,形成视觉词典。本发明专利技术能构造出更加更加有效的视觉词典,提高图像的分类准确率。

【技术实现步骤摘要】

本专利技术涉及图像特征提取,视觉聚类以及图像分类
,尤其涉及一种基于D-S证据理论的视觉词典构建方法
技术介绍
图像分类是计算机视觉领域内的一个重点研究的问题,它能够将不同类别的目标区分开来,在卫星遥感,航空航天,生物医学等方面具有广泛的应用。近年来,使用词袋(bag-of-words)模型表示图像并实现图像对象分类的方法,由于其实现了基于多个图像特征的图像表示模型,因此在图像分类中受到较大的关注。而在词袋模型中需要首先构建图像类的视觉词典。视觉词典构建的好坏直接影响了图像分类的效果。目前传统的视觉字典的构造方法是在提取图像特征例如颜色,纹理等的基础上,将提取的图像特征使用聚类方法,例如K均值(K-Means)聚类,来构造视觉词典。如Jayech等人将图像分成块,分别使用高斯混合模型 Gaussian Mixture Model)和灰度共生矩阵 Gray Level Co-occurrenceMatrix)提取分块的颜色特征和纹理特征,经过K均值聚类后形成视觉词典,进而利用贝叶斯网络实现图像的分类。WiIlamowski等人使用朴素贝叶斯和支持向量机实现图像的分类识别则是在提取图像的SIFT (scale invariant feature transform)特征后,经过K均值聚类构建词汇表。Xu等人经过SIFT特征提取和DENCLUE聚类后获得视觉字典,然后计算点间互信息获得重要的特征,使用支持向量机实现图像分类识别。上面所提到的构建视觉字典方法一般是将提取的多个特征形成统一的特征向量,然后使用聚类方法。这种方法在视觉聚类的过程中只考虑了特征的视觉相似性而导致忽略了不同特征对构建视觉字典的影响。因此如何考察不同特征的视觉相似性,区分出对聚类影响度不同的特征,从而构造更加精确地视觉字典就显得非常重要。D-S证据理论是由Dempster提出并有Shafer进一步发展而来的,是一种信息融合技术。这个理论是经典概率论的一种扩充形式,是对传统Bayes理论的推广。它是一种建立在置信函数和似然函数上的数学证据理论,将证据的信任函数与概率论的上下值相联系,用信任函数和似然度来解释多值映射,并在此基础上形成了处理不确定信息的证据理论。它可以结合一个事件的不同证据信息来计算这个事件发生的概率,能够处理被忽略或者丢失的信息,提供不同信息源之间信息的不精确性和冲突估计。在D-S证据理论中,基本概率赋值函数用来描述每个传感器或同一传感器的某一特征对假设命题的影响,置信函数和似然函数表示某个假设命题的可信度,各个特征的共同作用则可用组合公式来计算,而命题的最后判断则用决策规则来实现。由于D-S证据理论在处理不确定信息方面的作用,它可以应用在图像分类,对象识别等多个方面。有鉴于此,有必要提供一种基于D-S证据理论的视觉词典构建方法以解决上述问题
技术实现思路
本专利技术提供了一种基于D-S证据理论的视觉词典构建方法,通过使用D-S证据理论考察不同特征的视觉相似性并进行特征融合,从而对初始视觉字典进行更进一步的细分,构造出更加更加有效的视觉词典,提高图像的分类准确率。为了实现上述目的,本专利技术实施例提供的技术方案如下:一种基于D-S证据理论的视觉词典构建方法,所述方法包括:S1、提取所有训练图像的SIFT特征,应用K均值实现初步的视觉字典分类得到K个子类;S2、设定分类阈值t和熵阈值S,其中分类阈值t表示设定的最大聚类个数即最大视觉单词个数,阈值s表示允许应用D-S证据理论进行子类分解的信息熵阈值;S3、判断当前的分类数是否小于t,若是,执行步骤S4,若否,执行步骤S7 ;S4、对已有分类计算每个子类的信息熵;S5、选择信息熵最大的一个子类作为当前要分解的类,判断该子类的信息熵是否大于s,若是,执行步骤S6,若否,执行步骤S7 ;S6、将当前信息熵最大的子类h运用D-S证据理论进一步分类;S7、计算新形成的子类的聚类中心,形成视觉词典。作为本专利技术的进一步改进,所述步骤S4中信息熵的计算公式为:本文档来自技高网
...

【技术保护点】
一种基于D?S证据理论的视觉词典构建方法,其特征在于,所述方法包括:S1、提取所有训练图像的SIFT特征,应用K均值实现初步的视觉字典分类得到K个子类;S2、设定分类阈值t和熵阈值s,其中分类阈值t表示设定的最大聚类个数即最大视觉单词个数,阈值s表示允许应用D?S证据理论进行子类分解的信息熵阈值;S3、判断当前的分类数是否小于t,若是,执行步骤S4,若否,执行步骤S7;S4、对已有分类计算每个子类的信息熵;S5、选择信息熵最大的一个子类作为当前要分解的类,判断该子类的信息熵是否大于s,若是,执行步骤S6,若否,执行步骤S7;S6、将当前信息熵最大的子类h运用D?S证据理论进一步分类;S7、计算新形成的子类的聚类中心,形成视觉词典。

【技术特征摘要】
1.一种基于D-S证据理论的视觉词典构建方法,其特征在于,所述方法包括: 51、提取所有训练图像的SIFT特征,应用K均值实现初步的视觉字典分类得到K个子类; 52、设定分类阈值t和熵阈值S,其中分类阈值t表示设定的最大聚类个数即最大视觉单词个数,阈值s表示允许应用D-S证据理论进行子类分解的信息熵阈值; 53、判断当前的分类数是否小于t,若是,执行步骤S4,若否,执行步骤S7; 54、对已有分类计算每个子类的信息熵; 55、选择信息熵最大的一个子类作为当前要分解的类,判断该子类的信息熵是否大于s,若是,执行步骤S6,若否,执行步骤S7 ; 56、将当前信息熵最大的子类h运用D-S证据理论进一步分类; 57、计算新形成的子类的聚类中心,形成视觉词典。2.根据权利要求1所述的方法,其特征在于,所述步骤S4中信息熵的计算公式为:3.根据权利要求1所述的方法,其特征在于,所述步骤S5中当前信息熵最大的子类为:4.根据权利要求1所述的方法,其特征在于,所述步骤S7中新形成的子类的聚类中心的计算公式为:5.根据权利要求1所述...

【专利技术属性】
技术研发人员:沈项军高海迪朱倩曾兰玲
申请(专利权)人:江苏大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1