基于感兴趣区域多元空间关系模型的图像分类方法技术

技术编号：9828953 阅读：123 留言：0更新日期：2014-04-01 18:03

一种基于感兴趣区域多元空间关系模型的图像分类方法本，涉及图像特征提取及模式识别，包括以下步骤：一、对原始图像检测感兴趣区域；二、提取感兴趣区域ROI的底层视觉特征；三、提取词袋特征；四、获得感兴趣区域ROI的多元空间关系；五、多元空间关系特征提取；六对词袋特征和多元空间关系特征进行特征融合及特征选择；七、使用参数优化后的分类器和步骤六获得的特征来训练样本。本发明专利技术提取的特征由于充分利用了感兴趣区域空间信息，使得图像分类精度大幅度提高；多元空间关系特征比纹理、颜色等其他图像特征更具有鲁棒性，对于训练集以外的新图像能够有效提取其自身固有的关键信息，因此取得更好的识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】一种本，涉及图像特征提取及模式识别，包括以下步骤：一、对原始图像检测感兴趣区域；二、提取感兴趣区域ROI的底层视觉特征；三、提取词袋特征；四、获得感兴趣区域ROI的多元空间关系；五、多元空间关系特征提取；六对词袋特征和多元空间关系特征进行特征融合及特征选择；七、使用参数优化后的分类器和步骤六获得的特征来训练样本。本专利技术提取的特征由于充分利用了感兴趣区域空间信息，使得图像分类精度大幅度提高；多元空间关系特征比纹理、颜色等其他图像特征更具有鲁棒性，对于训练集以外的新图像能够有效提取其自身固有的关键信息，因此取得更好的识别效果。【专利说明】
本专利技术涉及图像特征提取及模式识别
技术介绍
随着移动互联网技术的迅速发展和智能手机的普及，人们能够轻易地通过各种移动设备上传图像，使得互联网上的图片数据量呈几何级增长。因此，对海量图像进行准确的分类和理解，成为机器视觉领域亟待解决的问题之一。除了互联网应用，图像分类技术还可以用于遥感、医学、农业和生物等领域。近年来，图像分类技术快速发展并得到广泛应用，已成为机器视觉、模式识别等领域的热点之一。目前图像分类的方法可归纳为三类:基于底层视觉特征的方法，基于结构模型的方法和基于词袋(bag of word)模型的方法。基于底层视觉特征的方法，是指直接获取图像全局或分块的形状、颜色和纹理等特征用于图像分类，该类方法计算较简单，但分类精度往往不能令人满意，且单一的描述算子适用的图像类别有限。基于结构模型的方法主要通过分割技术确定图像的不同组成部分，进而考虑不同组成部分之间的相互关系来进行图像分类。这类方法...

【技术保护点】
一种基于感兴趣区域多元空间关系模型的图像分类方法，其特征在于：至少包括以下步骤：步骤一：对原始图像检测感兴趣区域使用兴趣区域检测算子检测图像库中每幅图像的感兴趣区域ROI；步骤二：提取感兴趣区域ROI的底层视觉特征对检测到的感兴趣区域，使用底层视觉特征描述算子提取特征向量；步骤三：提取词袋特征使用聚类算法对ROI底层视觉特征向量进行聚类，所有的聚类中心构成词袋模型中的视觉词典，用ROI聚类号作为其类别标签，并统计每幅图像出现视觉单词的频率作为分类的词袋特征；步骤四：获得感兴趣区域ROI的多元空间关系分两种情况来提取ROI的多元空间关系MSRR：（1）若两区域相交，则用其拓扑关系(交叠、包含、被包含)作为MSRR关系；（2）若两区域不相交，先根据尺寸和距离判断两区域是否相关，对于相关的区域，则根据中心点方向角获得定性方向关系作为MSRR关系；步骤五：多元空间关系特征提取统计感兴趣区域间每种MSRR关系出现的频率作为多元空间关系特征；步骤六：对词袋特征和多元空间关系特征进行特征融合及特征选择对于每个样本，首先将分别提取的词袋特征和多元空间关系特征合并作为融合后的全部特征向量；然后采用特征选...

【技术特征摘要】

【专利技术属性】
技术研发人员：王生生，刘东，谷方明，
申请(专利权)人：吉林大学，
类型：发明
国别省市：吉林;22

全部详细技术资料下载我是这个专利的主人