【技术实现步骤摘要】
本专利技术涉及图像特征提取,视觉聚类以及图像分类
,尤其涉及一种基于D-S证据理论的视觉词典构建方法。
技术介绍
图像分类是计算机视觉领域内的一个重点研究的问题,它能够将不同类别的目标区分开来,在卫星遥感,航空航天,生物医学等方面具有广泛的应用。近年来,使用词袋(bag-of-words)模型表示图像并实现图像对象分类的方法,由于其实现了基于多个图像特征的图像表示模型,因此在图像分类中受到较大的关注。而在词袋模型中需要首先构建图像类的视觉词典。视觉词典构建的好坏直接影响了图像分类的效果。目前传统的视觉字典的构造方法是在提取图像特征例如颜色,纹理等的基础上,将提取的图像特征使用聚类方法,例如K均值(K-Means)聚类,来构造视觉词典。如Jayech等人将图像分成块,分别使用高斯混合模型 Gaussian Mixture Model)和灰度共生矩阵 Gray Level Co-occurrenceMatrix)提取分块的颜色特征和纹理特征,经过K均值聚类后形成视觉词典,进而利用贝叶斯网络实现图像的分类。WiIlamowski等人使用朴素贝叶斯和支持向量机实现图像的分类识别则是在提取图像的SIFT (scale invariant feature transform)特征后,经过K均值聚类构建词汇表。Xu等人经过SIFT特征提取和DENCLUE聚类后获得视觉字典,然后计算点间互信息获得重要的特征,使用支持向量机实现图像分类识别。上面所提到的构建视觉字典方法一般是将提取的多个特征形成统一的特征向量,然后使用聚类方法。这种方法在视觉聚类的过程中只考虑了特征 ...
【技术保护点】
一种基于D?S证据理论的视觉词典构建方法,其特征在于,所述方法包括:S1、提取所有训练图像的SIFT特征,应用K均值实现初步的视觉字典分类得到K个子类;S2、设定分类阈值t和熵阈值s,其中分类阈值t表示设定的最大聚类个数即最大视觉单词个数,阈值s表示允许应用D?S证据理论进行子类分解的信息熵阈值;S3、判断当前的分类数是否小于t,若是,执行步骤S4,若否,执行步骤S7;S4、对已有分类计算每个子类的信息熵;S5、选择信息熵最大的一个子类作为当前要分解的类,判断该子类的信息熵是否大于s,若是,执行步骤S6,若否,执行步骤S7;S6、将当前信息熵最大的子类h运用D?S证据理论进一步分类;S7、计算新形成的子类的聚类中心,形成视觉词典。
【技术特征摘要】
1.一种基于D-S证据理论的视觉词典构建方法,其特征在于,所述方法包括: 51、提取所有训练图像的SIFT特征,应用K均值实现初步的视觉字典分类得到K个子类; 52、设定分类阈值t和熵阈值S,其中分类阈值t表示设定的最大聚类个数即最大视觉单词个数,阈值s表示允许应用D-S证据理论进行子类分解的信息熵阈值; 53、判断当前的分类数是否小于t,若是,执行步骤S4,若否,执行步骤S7; 54、对已有分类计算每个子类的信息熵; 55、选择信息熵最大的一个子类作为当前要分解的类,判断该子类的信息熵是否大于s,若是,执行步骤S6,若否,执行步骤S7 ; 56、将当前信息熵最大的子类h运用D-S证据理论进一步分类; 57、计算新形成的子类的聚类中心,形成视觉词典。2.根据权利要求1所述的方法,其特征在于,所述步骤S4中信息熵的计算公式为:3.根据权利要求1所述的方法,其特征在于,所述步骤S5中当前信息熵最大的子类为:4.根据权利要求1所述的方法,其特征在于,所述步骤S7中新形成的子类的聚类中心的计算公式为:5.根据权利要求1所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。