当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于显著性的快速场景分析方法技术

技术编号:9826431 阅读:125 留言:0更新日期:2014-04-01 15:49
本发明专利技术提出了一种基于显著性的快速场景分析方法,所述方法借鉴人类视觉系统的神经机制来设计计算机视觉模型,提供了一种自底向上、各个特征图可并行计算的机制,并且将多种特征在多尺度下进行融合,最后合成一张综合的视觉显著图。通过两层的胜者为王神经网络得到显著性区域,最后通过禁止返回机制,抑制当前显著性区域,转而寻找下一个显著性区域,直到遍历所有显著性区域。该方法模拟了人类视觉注意力系统智能地处理图像信息,在一幅图像中快速提取人眼所能观察到的引人注意的区域。

【技术实现步骤摘要】
【专利摘要】本专利技术提出了,所述方法借鉴人类视觉系统的神经机制来设计计算机视觉模型,提供了一种自底向上、各个特征图可并行计算的机制,并且将多种特征在多尺度下进行融合,最后合成一张综合的视觉显著图。通过两层的胜者为王神经网络得到显著性区域,最后通过禁止返回机制,抑制当前显著性区域,转而寻找下一个显著性区域,直到遍历所有显著性区域。该方法模拟了人类视觉注意力系统智能地处理图像信息,在一幅图像中快速提取人眼所能观察到的引人注意的区域。【专利说明】
本专利技术属于计算机视觉领域,具体指的是。
技术介绍
现代人类视觉系统的研究发现,人类视觉系统能够在复杂场景中迅速地将注意力集中在少数几个显著的视觉对象上,这就是视觉选择注意。在计算机视觉研究方面,依据人类视觉选择注意的基本原理,开发能够进行智能图像信息处理的计算机视觉注意模型就成为我们的一大任务。神经生理学家证明了神经元是如何适应自己来更好的感知感兴趣的物体。计算神经科学家已经构建了现实的神经网络模型来模拟和解释注意力行为。生物科学,脑科学及注意的认知等方面的研究发现,人类的视觉注意过程包括两个方面,一方面是对自底向上的初级视觉特征的加工,另一方面是由自顶向下的任务指导,两方面结合共同完成了视觉的选择性注意。
技术实现思路
本专利技术所要解决的技术问题是为了克服现有技术的不足,提出一种快速场景分析方法。所述方法能够模拟人类视觉注意力系统智能地处理图像信息,在一幅图像中快速提取人眼所能观察到的引人注意的区域。为了解决上述技术问题,本专利技术所采用的技术方案是:,包括如下步骤:步骤A,采集彩色图像;步骤B,对步骤A得到的彩色图像,使用线性滤波器提取初级视觉特征,所述初级视觉特征包括颜色,亮度和方向三个特征维度,再根据所述初级视觉特征构建N个初级特征通道;步骤C,对步骤B得到的每个初级视觉特征通道构建一个九层的高斯金字塔;步骤D,对步骤C得到的每个高斯金字塔,使用中央周边差操作产生M幅特征图,共计N*M幅特征图;步骤E,将步骤D得到的N*M幅特征图合并成一幅显著图;步骤F,根据步骤E得到的显著图,使用胜者为王竞争网络寻找其中存在的显著性最高的关注焦点,定位该关注焦点的区域,采用禁止返回机制来确保注意力不返回已经关注过的区域,使注意力依照显著性降序地关注图像的不同区域。所述中央周边差操作是指:将大尺度的图像和小尺度的图像进行跨尺度减操作,得到局部中心和周边背景信息之差。步骤E中,所述显著图生成的过程如下:步骤E-1,对步骤D得到的不同特征维度的N*M幅特征图中的每一幅特征图,采用迭代标准化方法突出各个特征维度的显著点,同时抑制噪声;步骤E-2,将经过步骤E-1迭代标准化操作后,得到的不同尺度上的亮度、颜色和方向的特征图叠加起来,形成各个特征维度对应的关注图;步骤E-3,对步骤E-2得到的不同特征维度下的关注图做加权叠加得到一幅显著图。所述初级特征通道的个数N=7 ;所述每个高斯金字塔产生的特征图个数M=6。本专利技术的有益效果是:本专利技术提出了一种快速场景分析方法,所述方法借鉴人类视觉系统的神经机制来设计计算机视觉模型,提供了一种自底向上、各个特征图可并行计算的机制,并且将多种特征在多尺度下进行融合,最后合成一张综合的视觉显著图。通过两层的胜者为王神经网络得到显著性区域,最后通过禁止返回机制,抑制当前显著性区域,转而寻找下一个显著性区域,直到遍历所有显著性区域。该方法模拟了人类视觉注意力系统智能地处理图像信息,在一幅图像中快速提取人眼所能观察到的引人注意的区域。【专利附图】【附图说明】图1是本专利技术的基于显著性的快速场景分析方法的流程图。【具体实施方式】下面结合附图,对本专利技术提出的一种快速场景分析方法进行详细说明:如图1所示,本专利技术的一种快速场景分析方法,其步骤如下步骤101,输入彩色图像;步骤102,对步骤101得到的彩色图像提取初级视觉特征,包括颜色,亮度和方向等共计三个特征维度的七个子特征。步骤103,对步骤102得到的每个初级视觉特征通道构建一个九层高斯金字塔;步骤104,对步骤103得到的高斯金字塔,使用中央周边差操作提取特征图;步骤105,对步骤104得到的不同特征维度的多幅特征图合并成一幅显著图;步骤106,寻找步骤105得到的显著图中存在的最显著的点,定位关注焦点的区域,引导注意焦点跳转。1.初级视觉特征提取对输入的一幅彩色图像,通过线性滤波提取其颜色、亮度、方向三个维度的初级视觉特征,其中颜色特征维度包括两个子特征通道,即红绿(RG)对比通道及蓝黄(BY)对比通道,亮度特征维度只包含一个特征通道,方向特征维度包含四个子特征通道,即θ={0° ,45° ,90° ,135° }四个方向的特征,因此初级视觉特征一共是三个特征维度的七个子特征通道。下面详细介绍这三个特征维度的初级视觉特征提取的具体算法。对于颜色特征维度,通过计算红绿(RG)对比通道以及蓝黄(BY)对比通道的颜色差图像来突出不同颜色通道产生的反差效果,颜色差可由式(I)和(2)计算:【权利要求】1.,其特征在于,包括如下步骤: 步骤A,米集彩色图像; 步骤B,对步骤A得到的彩色图像,使用线性滤波器提取初级视觉特征,所述初级视觉特征包括颜色,亮度和方向三个特征维度,再根据所述初级视觉特征构建N个初级特征通道; 步骤C,对步骤B得到的每个初级视觉特征通道构建一个九层的高斯金字塔; 步骤D,对步骤C得到的每个高斯金字塔,使用中央周边差操作产生M幅特征图,共计N*M幅特征图; 步骤E,将步骤D得到的N*M幅特征图合并成一幅显著图; 步骤F,根据步骤E得到的显著图,使用胜者为王竞争网络寻找其中存在的显著性最高的关注焦点,定位该关注焦点的区域,采用禁止返回机制来确保不返回已经关注过的区域。2.根据权利要求1所述的,其特征在于,所述中央周边差操作是指:将大尺度的图像和小尺度的图像进行跨尺度减操作,得到局部中心和周边背景信息之差。3.根据权利要求1所述的,其特征在于,步骤E中,所述显著图生成的过程如下: 步骤E-1,对步骤D得到的不同特征维度的N*M幅特征图中的每一幅特征图,采用迭代标准化方法突出各个特征维度的显著点,同时抑制噪声; 步骤E-2,将经过步骤E-1迭代标准化操作后,得到的不同尺度上的亮度、颜色和方向的特征图叠加起来,形成各个特征维度对应的关注图; 步骤E-3,对步骤E-2得到的不同特征维度下的关注图做加权叠加得到一幅显著图。4.根据权利要求1或3所述的,其特征在于,所述初级特征通道的个数N=7 ;所述每个高斯金字塔产生的特征图个数M=6。【文档编号】G06T7/00GK103679718SQ201310658853【公开日】2014年3月26日 申请日期:2013年12月6日 优先权日:2013年12月6日 【专利技术者】王敏 申请人:河海大学本文档来自技高网...

【技术保护点】
一种基于显著性的快速场景分析方法,其特征在于,包括如下步骤:步骤A,采集彩色图像;步骤B,对步骤A得到的彩色图像,使用线性滤波器提取初级视觉特征,所述初级视觉特征包括颜色,亮度和方向三个特征维度,再根据所述初级视觉特征构建N个初级特征通道;步骤C,对步骤B得到的每个初级视觉特征通道构建一个九层的高斯金字塔;步骤D,对步骤C得到的每个高斯金字塔,使用中央周边差操作产生M幅特征图,共计N*M幅特征图;步骤E,将步骤D得到的N*M幅特征图合并成一幅显著图;步骤F,根据步骤E得到的显著图,使用胜者为王竞争网络寻找其中存在的显著性最高的关注焦点,定位该关注焦点的区域,采用禁止返回机制来确保不返回已经关注过的区域。

【技术特征摘要】

【专利技术属性】
技术研发人员:王敏
申请(专利权)人:河海大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1