The invention discloses a visual saliency detection method combining machine learning, background suppression and perceived positive feedback. An algorithm framework is proposed to simulate the mechanism of human eye micro vision and perceptual fading. First, the image is directly and roughly divided into gaze and non gaze regions. By repeated sampling of pixels in the two regions, the micro vision is simulated by repeated scanning of the gaze region. A number of PELM models are constructed after sampling, and the multi model classification results are superimposed to form a rough saliency map. Then, the coarse saliency map is used to suppress the background by RBD algorithm, and the positive feedback iterative process based on PELM is constructed for the gaze area. If the PELM classification results are stable in the iteration, the visual perception is saturated and the loop is finished. The PELM classification results can be regarded as a visual stimulus, and the superimposed stimulus can be used to form a new saliency map, which can be used to achieve a complete data driven and stepwise refinement of saliency detection.
【技术实现步骤摘要】
机器学习、背景抑制与感知正反馈相结合的视觉显著性检测方法
本专利技术涉及人类视觉模拟
,具体地讲是利用机器学习实时在线建模,构建一种完全数据驱动的视觉显著性自动检测方法。
技术介绍
视觉显著性是构成视觉注意的基础。视觉显著性检测是当今计算机视觉研究领域的热点问题。如何模拟人类脑-眼系统,实现仿真人类视觉的机器视觉,一直是研究者们的探索方向。自然图像是典型的非结构化数据,而机器学习适合对非结构化数据开展建模。近年来,由浅层和深层神经网络构造的机器学习算法、基于自底向上和自顶向下框架,已被应用于解决视觉显著性检测等问题。自底向上框架可采用数据驱动的方法来建模,然而算法通常受一些先验知识的限制约束,且由于训练样本常不准确,模型容易出偏差。自顶向下框架中,深度学习已成功地用于图像分割和显著性检测;到目前为止,深度学习为基础的算法在许多应用中都反映了最好性能,但其缺陷也明显:深度学习需要大量已标记的样本数据,深层网络往往需要手工设计,相比于浅层神经网络,其训练需要更高的硬件资源,目前无法实时在线进行。显然,如果实践中没有合适的先验知识和足够的有效样本,现有方法可能会无 ...
【技术保护点】
一种机器学习、背景抑制与感知正反馈相结合的视觉显著性检测方法,其特征在于:包括以下步骤:1)输入图像。将图像边框区域一定宽度范围作为非注视区(负样本候选区),而余下的矩形区域为注视区(正样本候选区)。2)通过集成的PELM(调和极限学习机)学习得到粗显著度图。①对正样本候选区域内的高梯度值像素(大于该区域平均梯度的像素)随机采样n个像素;对负样本区域内所有像素,进行等量的随机采样。采样过程可重复3‑5次,模拟人眼微跳视对注视区的重复扫描。②利用样本像素与其8邻域像素的RGB特征,构成正负样本集。重复采样可形成多个样本集。分别利用这些样本集,进行多个PELM(调和极限学习机) ...
【技术特征摘要】
1.一种机器学习、背景抑制与感知正反馈相结合的视觉显著性检测方法,其特征在于:包括以下步骤:1)输入图像。将图像边框区域一定宽度范围作为非注视区(负样本候选区),而余下的矩形区域为注视区(正样本候选区)。2)通过集成的PELM(调和极限学习机)学习得到粗显著度图。①对正样本候选区域内的高梯度值像素(大于该区域平均梯度的像素)随机采样n个像素;对负样本区域内所有像素,进行等量的随机采样。采样过程可重复3-5次,模拟人眼微跳视对注视区的重复扫描。②利用样本像素与其8邻域像素的RGB特征,构成正负样本集。重复采样可形成多个样本集。分别利用这些样本集,进行多个PELM(调和极限学习机)学习建模。③用PELM模型对所有像素进行二值分类。每个PELM二值分类结果可被视为一种视觉刺激,将多个二值刺激图进行叠加可以形成粗显著图。3)利用背景检测技术减少粗显著图的背景噪声,以降低噪声样本影响。用RBD(鲁棒的背景检测算法)先检测背景像素,然后抑制粗显著图中的背景像素来优化粗显著图。4)通过正反馈迭代循环来强化目标;①阈值化优化后的粗显著性图,得到新的二值化注视区域(BW_i);②如果前一个注视区域...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。