基于尺度选择的自顶向下的视觉显著性提取方法技术

技术编号:8489973 阅读:398 留言:0更新日期:2013-03-28 12:20
本发明专利技术公开了一种基于尺度选择的自顶向下的视觉显著性提取方法,包括两个阶段,训练阶段学习得到非线性模型,并找到多尺度合并中的最佳的尺度,用于显著值的计算。显著值计算阶段根据训练阶段得到的最佳尺度和非线性模型来提取显著图。本发明专利技术提出的方法充分考虑人的意图,而且利用多尺度的上下文关系,能有效地提取出与人的意图相关的视觉显著的区域,并可以应用于物体检测等领域。

【技术实现步骤摘要】

本专利技术涉及的是一种视觉显著性的计算方法,特别涉及一种,属于视觉显著性领域。
技术介绍
视觉注意是帮助人类视觉系统准确有效的识别场景的一种重要机制。获取图像中的显著区域是计算机视觉领域的一个重要的研究课题。它可以帮助图像处理系统在后续处理步骤中合理的分配计算资源。视觉显著区域提取被广泛的应用于很多计算机视觉应用当中,如感兴趣物体分割、物体识别、自适应图像压缩、内容敏感的图像缩放、图像检索等。关于视觉显著性的检测分为两类快速的、与任务无关的、数据驱动的自底向上的显著性检测和较慢的、与任务相关的、目标驱动的自顶向下的显著性检测。现有的视觉显著性检测方法大都是属于前一类的,通过计算各种形式的图像内容和场景的对比度来获得视觉显著性。本专利技术所涉及的是后一类。运用机器学习的方法学习模型来提取目标相关的显著区域,该方法可以应用于物体检测、物体识别等领域。自顶向下的视觉显著性检测方法主要有基于特征融合的方法和基于信息最大化原则的方法。基于特征融合的方法主要是通过调整不同特征通道的权重值来获得自顶向下的显著性。Frintrop等人于2005年Pattern Recognition中提出了 VO本文档来自技高网...

【技术保护点】
一种基于尺度选择的自顶向下的视觉显著性提取方法,其特征在于,包括以下两个阶段,每个阶段四个步骤:第一阶段:训练阶段S1:对每幅图像进行稠密采窗,对每个窗提取特征描述符;S2:根据训练集图像得到的特征描述符构建视觉词典,然后用某一种编码方法将训练集图像的特征描述符映射为编码向量;S3:将每一个窗作为中心窗,将之与周边的窗的编码向量做多尺度的合并,每个窗都生成新的特征向量,由于做了多尺度的融合,所以每个窗会对应多个特征向量;S4:将不同尺度的特征向量和真实标注分别输入到支撑向量机训练,得到不同尺度的非线性模型,用于预测显著值,将预测得到的结果和真实标注用KLD做评价,取KLD值最小的尺度作为最佳尺...

【技术特征摘要】

【专利技术属性】
技术研发人员:张瑞仇媛媛朱俊付赛男邹维嘉朱玉琨
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1