一种基于视觉词袋模型的目标分类方法和系统技术方案

技术编号:12067943 阅读:101 留言:0更新日期:2015-09-18 01:59
本发明专利技术提供一种基于视觉词袋模型的目标分类方法和系统,该方法包括:获得样本图片的特征点并得到各个特征点的位置信息和描述信息,所述样本图片包括第一分类图片和第二分类图片;聚类各个特征点的描述信息,以生成以描述信息作为视觉词条的视觉词典;基于各个特征点中的目标特征点的描述信息,找到与目标特征点的描述信息匹配的一个或多个视觉词条;基于各个特征点的位置信息,计算各个特征点的描述信息对目标特征点在该目标特征点匹配的视觉词条上的权重;结合所有目标特征点,基于所有目标特征点的位置信息,产生样本图片的带有空间信息的基于视觉词条的权重的特征模型。

【技术实现步骤摘要】

本公开一般涉及图像处理领域,且更具体地涉及基于视觉词袋模型的目标分类技 术。
技术介绍
视觉词袋模型是当前目标分类或目标识别领域的最好的方法之一。该模型能够很 好的表达目标的特征力求获得更高的识别率。 视觉词袋模型的构建是基于特征点的特征的,因此对于位置、光照、旋转以及仿射 变换有着不变性。同时,该模型对部分遮挡和偏移也有较好的鲁棒性。但是,由于传统的视 觉词袋模型直接将目标中的所有特征点生成直方图特征,而不考虑目标中的特征点的空间 信息,因此,不能获得更好的识别率。另外,传统的基于视觉词袋模型的目标分类或目标识 别方式使用大量的重复计算,耗用了大量的计算资源。 参考文献: Wang等人在2012年10月25日公开的美国专利申请公开号US2012269432(A1), 题为 "IMAGE RETRIEVAL USING SPATIAL BAG-OF-FEATURES"; Lin等人2013年5月23日公开的美国专利申请公开号US2013132377(A1),题为 "Systems and Methods for Localized Bag-of-Features Retrieval,'。
技术实现思路
所谓词袋,就是包含一组数据的打包或封装。在一个视觉词袋中往往包含了若干 幅图的基本特征元素,例如若干幅图的特征,包括形状、结构、颜色、纹理等的特征。由于视 觉词袋具有一类或多类图像的一些特征,故而当提取出视觉词袋中的元素时,就可以对相 近类图像进行描述,同时也可以用作不同类别图像的分类。视觉词袋运用在某一个图片中, 也可形象地称为视觉词典,其于包括一系列视觉词条,使得该图片的各种特征可以用视觉 词典中的各个视觉词条来表示。 本技术除了考虑视觉词袋的技术,还考虑图片上的各个点之间的空间位置关系, 来更准确地构造用于分类图片的分类模型,从而更准确地对图片进行分类。 根据本公开的一个方面,提供一种基于视觉词袋模型的目标分类方法,包括:获得 样本图片的特征点并得到各个特征点的位置信息和描述信息,所述样本图片包括第一分类 图片和第二分类图片;聚类各个特征点的描述信息,以生成以描述信息作为视觉词条的视 觉词典;基于各个特征点中的目标特征点的描述信息,找到与目标特征点的描述信息匹配 的一个或多个视觉词条;基于各个特征点的位置信息,计算各个特征点的描述信息对目标 特征点在该目标特征点匹配的视觉词条上的权重;结合所有目标特征点,基于所有目标特 征点的位置信息,产生样本图片的带有空间信息的基于视觉词条的权重的特征模型。 根据本公开的另一方面,提供一种基于视觉词袋模型的目标分类系统,包括:获得 装置,被配置为获得样本图片的特征点并得到各个特征点的位置信息和描述信息,所述样 本图片包括第一分类图片和第二分类图片;聚类装置,被配置为聚类各个特征点的描述信 息,以生成以描述信息作为视觉词条的视觉词典;找到装置,被配置为基于各个特征点中的 目标特征点的描述信息,找到与目标特征点的描述信息匹配的一个或多个视觉词条;计算 装置,被配置为基于各个特征点的位置信息,计算各个特征点的描述信息对目标特征点在 该目标特征点匹配的视觉词条上的权重;产生装置,被配置为结合所有目标特征点,产生样 本图片的带有空间信息的基于视觉词条的权重的特征模型。 根据本公开的各个方面,提供更灵活且更准确的分类识别方式且消耗更少的计算 资源、提供更快的处理速度。【附图说明】 图1示出了应用本技术的示例硬件环境框图。 图2示出了根据本技术的一个实施例的基于视觉词袋模型的目标分类方法的示 例流程图。 图3示出了根据本技术的另一个实施例的用于目标分类的示例大体流程图。 图4示出了根据本技术的另一个实施例的生成视觉词典和得到分类器的示例流 程图。 图5示出了根据本技术的另一个实施例的基于视觉词典和分类器来进行目标分 类的功能流程图。 图6示出了图4所示的特征点提取与描述的具体示例步骤。 图7示出图4所示的生成视觉词典的具体示例步骤。 图8示出了图4所示的空间视觉词典匹配的具体示例步骤。 图9示出了图8所示的投票过程的具体示例步骤。 图10示出了图8所示的空间编码过程的具体示例步骤。 图IlA示出了图10所示的空间编码过程中计算特征点p对目标特征点Ri, i在 该目标特征点Ri, ^匹配的第k个视觉词条上的权重的示意图。 图IlB示出了图10所示的空间编码过程中计算各个特征点对其他特征点在匹配 的视觉词条上的权重的影响因子的示意图。 图12示出了产生用于输入分类器训练的样本图片的带有空间信息的基于视觉词 条的权重的特征模型的示意图。 图13示出了根据本技术的另一实施例的基于视觉词典和分类器来进行目标分类 的系统的方框图。【具体实施方式】 现在将详细参照本专利技术的具体实施例,在附图中例示了本专利技术的例子。尽管将结 合具体实施例描述本专利技术,但将理解,不是想要将本专利技术限于所述的实施例。相反,想要覆 盖由所附权利要求限定的在本专利技术的精神和范围内包括的变更、修改和等价物。应注意,这 里描述的方法步骤都可以由任何功能块或功能布置来实现,且任何功能块或功能布置可被 实现为物理实体或逻辑实体、或者两者的组合。 为了使本领域技术人员更好地理解本专利技术,下面结合附图和【具体实施方式】对本发 明作进一步详细说明。 图1示出了应用本技术的示例硬件环境框图。 -个通用的硬件系统包括随机存取存储器(RAM) (Hl)、只读存储器(ROM) (H2)、数 据总线(H3)、重要处理单元/数字信号处理器(CPU/DSP) (H4)、输入/输出总线(H5),显示 屏(H6)以及输入/输出设备(H7)等。例如,本技术中的实施例的基于视觉词袋模型的目标 分类方法可以在图1所示的CPU/DSP中执行,且执行结果、例如分类模型和/或分类结果可 以被显示在显示屏(H6)上,或输出到输出设备(H7)。 图2示出了根据本技术的一个实施例的基于视觉词袋模型的目标分类方法的示 例流程图。 图2所示的基于视觉词袋模型的目标分类方法包括:步骤S11,获得样本图片的特 征点并得到各个特征点的位置信息和描述信息,所述样本图片包括第一分类图片和第二分 类图片;步骤S12,聚类各个特征点的描述信息,以生成以描述信息作为视觉词条的视觉词 典;步骤S13,基于各个特征点中的目标特征点的描述信息,找到与目标特征点的描述信息 匹配的一个或多个视觉词条;步骤S14,基于各个特征点的位置信息,计算各个特征点的描 述信息对目标特征点在该目标特征点匹配的视觉词条上的权重;步骤S15,结合所有目标 特征点,基于所有目标特征点的位置信息,产生样本图片的带有空间信息的基于视觉词条 的权重的特征模型。 如此,可以基于各个特征点的位置对目标特征点的位置的在视觉词条上的权重影 响,来产生样本图片中的所有目标特征点的带有空间信息的基于视觉词条的权重的特征模 型,从而在日后进行分类训练和实际分类操作中获得图片的基于空间位置的更准确的分 类。该模型同样能够应用于基于该模型的其它应用领域,如图像检索、图像匹配等,而不限 于图像分类和图像识别领域。 在一个实施例中,各个特征点的位置信息可以包括各个特征点之间的距离信息。 距离越大,一个特征点的描述信息对另一本文档来自技高网...

【技术保护点】
一种基于视觉词袋模型的目标分类方法,包括:获得样本图片的特征点并得到各个特征点的位置信息和描述信息,所述样本图片包括第一分类图片和第二分类图片;聚类各个特征点的描述信息,以生成以描述信息作为视觉词条的视觉词典;基于各个特征点中的目标特征点的描述信息,找到与目标特征点的描述信息匹配的一个或多个视觉词条;基于各个特征点的位置信息,计算各个特征点的描述信息对目标特征点在该目标特征点匹配的视觉词条上的权重;结合所有目标特征点,基于所有目标特征点的位置信息,产生样本图片的带有空间信息的基于视觉词条的权重的特征模型。

【技术特征摘要】

【专利技术属性】
技术研发人员:李静雯贺娜师忠超刘殿超鲁耀杰
申请(专利权)人:株式会社理光
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1