基于短语包模型的图像类别标注方法技术

技术编号：4015931 阅读：222 留言：0更新日期：2012-04-11 18:40

本发明专利技术为一种基于短语包模型的图像类别标注方法，该方法在现有的字包模型表示的基础上，引入视觉字之间的位置信息，提出了短语包模型表示策略。本发明专利技术有效的解决了传统字包模型缺乏位置信息导致判别性不足与加入分块的位置信息后对目标位移敏感之间的矛盾；使得图像在引入视觉字之间的位置信息而增加了判别性的同时，消除了对目标在图像中位移的敏感性，有效地提高了图像类别标注系统的性能，具有重要的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于模式识别与信息处理
，涉及基于短语包模型的图像类别标注方法，具体的是一种图像分类方法。
技术介绍
由于数码相机等数码产品的低廉价格，图片、视频数据可以很方便的拍摄并保存成方便计算机处理的电子形式。同时，互联网资源的迅猛发展，使得广大用户开始面临一个庞大的数据资源。单纯的利用人力来维护和组织这些数据已经变得不现实。因此，开发一种技术来完成图像、视频数据的自动标注，成了一个热点问题。总的来说，如何合理的表示图像比后来用于对这些表示进行分类的分类技术更为重要。道理可以通过一个例子来说两幅不同类别的图像，由于表示策略不好，被表示成了相同的向量；此时，即使使用一个万能的分类器对这种情况也是无能为力的。因此，图像内容表示，是图像类别标注技术中核心的问题之一。最初，人们更喜欢使用从整幅图像抽取的全局特征来表示图像。但是这种全局特征在表示图像方面遇到很多问题，比如它对目标轻微的遮挡以及复杂背景的混淆缺乏鲁棒性。另一方面，基于局部图像块的方法，却受到了越来越多的关注。人体生理学家发现，人类视觉早期分为“留意前”阶段(pre-attentive stage)和“留意”阶段(attentive stage) 0 在“留意前”阶段，一些比较特别的局部特征开始捕获人的注意力；然后，在“留意”阶段，人类视觉器官开始注意这些局部特征之间的关系。在这种思想的影响下，图像内容分类取得了重大进展。对应着“留意前”阶段，大量的局部特征检测子和局部特征描述子被提出，用来捕获图像中比较特别的局部特征。例如，目前的检测子有角点检测子、区域检测子、水滴...

【技术保护点】
基于短语包模型的图像类别标注方法，其特征在于，该图像类别标注方法，通过分析字包模型中视觉字之间的位置关系，将视觉字发展为视觉短语，进而提出基于短语包模型的图像内容表示，然后利用短语包模型的表示结果训练分类器以及输入分类器进行类别标注。

【技术特征摘要】

【专利技术属性】
技术研发人员：肖柏华，张琳波，王春恒，惠康华，邵允学，蔡新元，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人