一种基于视觉词袋模型的目标分类方法和系统技术方案

技术编号：12067943 阅读：101 留言：0更新日期：2015-09-18 01:59

本发明专利技术提供一种基于视觉词袋模型的目标分类方法和系统，该方法包括：获得样本图片的特征点并得到各个特征点的位置信息和描述信息，所述样本图片包括第一分类图片和第二分类图片；聚类各个特征点的描述信息，以生成以描述信息作为视觉词条的视觉词典；基于各个特征点中的目标特征点的描述信息，找到与目标特征点的描述信息匹配的一个或多个视觉词条；基于各个特征点的位置信息，计算各个特征点的描述信息对目标特征点在该目标特征点匹配的视觉词条上的权重；结合所有目标特征点，基于所有目标特征点的位置信息，产生样本图片的带有空间信息的基于视觉词条的权重的特征模型。

全部详细技术资料下载

【技术实现步骤摘要】

本公开一般涉及图像处理领域，且更具体地涉及基于视觉词袋模型的目标分类技术。
技术介绍
视觉词袋模型是当前目标分类或目标识别领域的最好的方法之一。该模型能够很好的表达目标的特征力求获得更高的识别率。视觉词袋模型的构建是基于特征点的特征的，因此对于位置、光照、旋转以及仿射变换有着不变性。同时，该模型对部分遮挡和偏移也有较好的鲁棒性。但是，由于传统的视觉词袋模型直接将目标中的所有特征点生成直方图特征，而不考虑目标中的特征点的空间信息，因此，不能获得更好的识别率。另外，传统的基于视觉词袋模型的目标分类或目标识别方式使用大量的重复计算，耗用了大量的计算资源。参考文献： Wang等人在2012年10月25日公开的美国专利申请公开号US2012269432(A1)，题为 "IMAGE RETRIEVAL USING SPATIAL BAG-OF-FEATURES"； Lin等人2013年5月23日公开的美国专利申请公开号US2013132377(A1)，题为 "Systems and Methods for Localized Bag-of-Features Retrieval，'。
技术实现思路
所谓词袋，就是包含一组数据的打包或封装。在一个视觉词袋中往往包含了若干幅图的基本特征元素，例如若干幅图的特征，包括形状、结构、颜色、纹理等的特征。由于视觉词袋具有一类或多类图像的一些特征，故而当提取出视觉词袋中的元素时，就可以对相近类图像进行描述，同时也可以用作不同类别图像的分类。视觉词袋运用在某一个图片中，也可形象地称为视觉词典，其...

【技术保护点】
一种基于视觉词袋模型的目标分类方法，包括：获得样本图片的特征点并得到各个特征点的位置信息和描述信息，所述样本图片包括第一分类图片和第二分类图片；聚类各个特征点的描述信息，以生成以描述信息作为视觉词条的视觉词典；基于各个特征点中的目标特征点的描述信息，找到与目标特征点的描述信息匹配的一个或多个视觉词条；基于各个特征点的位置信息，计算各个特征点的描述信息对目标特征点在该目标特征点匹配的视觉词条上的权重；结合所有目标特征点，基于所有目标特征点的位置信息，产生样本图片的带有空间信息的基于视觉词条的权重的特征模型。

【技术特征摘要】

【专利技术属性】
技术研发人员：李静雯，贺娜，师忠超，刘殿超，鲁耀杰，
申请(专利权)人：株式会社理光，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人