基于多通道浅层特征的视频兴趣区域快速预选方法及系统技术方案

技术编号:19328130 阅读:32 留言:0更新日期:2018-11-03 14:59
本发明专利技术公开了一种基于多通道浅层特征的视频兴趣区域快速预选方法,包括:读取视频数据流,并将视频数据流分解为RGB源尺寸图像;对RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及将第一判别值与第一存储值进行比较,得到第一差值,如果第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对图像块进行其它判别。本发明专利技术的视频兴趣区域快速预选方法能够满足目标识别区域的筛选功能,同时可以明显加速视频数据的处理速度。

Fast video preselection method and system based on multi-channel shallow features

The invention discloses a fast pre-selection method of video interest region based on multi-channel shallow feature, which includes: reading video data stream and decomposing video data stream into RGB source size image; processing RGB source size image to obtain the average value of three color channel data of each pixel and the number of red single channels. The first discriminant value is obtained based on the average value of the three color channel data, the red single channel data, the green single channel data and the blue single channel data, and the first discriminant value is compared with the first storage value to obtain the first difference, if the first difference is the first difference value. If the threshold is larger than the predetermined threshold, the image block is determined to be a significant image block, and no further discrimination is made on the image block. The fast pre-selection method of the video interest region of the present invention can satisfy the filtering function of the target recognition region, and can obviously accelerate the processing speed of the video data.

【技术实现步骤摘要】
基于多通道浅层特征的视频兴趣区域快速预选方法及系统
本专利技术属于图像处理
,特别涉及一种基于多通道浅层特征的视频兴趣区域快速预选方法及系统。
技术介绍
随着光学、电子技术的不断发展,基于视频图像的技术方案在工业设计、家庭娱乐、交通监控等领域得到广泛应用。高性能的计算机处理器芯片、专用的GPU加速器、更高效的图像处理算法、强大的云计算平台使得图像内容检索、分析性能得到进一步的提升。视频显著区域提取是计算机图像智能识别、内容分析的重要步骤。计算机视频采集原始数据流具有体积大、冗余内容多、有效数据量小等特点,需要采用一定的预处理技术多兴趣目标范围进行快速甄别,区分背景区域,缩小检索的视野范围,为后继的目标识别算法进行初步的区域筛选,目前准确率较高的智能识别技术算法较复杂,处理时间较长,开发快速的显著区域提取技术有利于提高识别系统整体的实时性,减少处理时间,降低系统的整体功耗。目前已有多种基于软件算法的计算机视觉处理算法进行视频、图像中目标的提取、识别、跟踪,有基于像素点迁移的,这些软件算法已经广泛应用于人脸识别、车牌识别等领域,但是这些算法通常流程复杂,需要高性能的CPU和GPU配置的硬件平台支持,算法实时性较差,同时这些算法对图片中目标的条件有限制,需要目标物理位置、势态角度、运行速度以及拍摄曝光强度等在可处理的范围内,通用的软件算法不满足高分辨率、大广角、实时性强、可便携的视频图像设备处理要求。FPGA(Field-ProgrammableGateArray),现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的技术。与专用集成电路(ASIC)相比,它是可编程的半定制电路,解决了定制电路的灵活性不足缺点,又克服了之前可编程器件门电路数有限的问题。与基于工作站、服务器的图像处理方法相比,采用FPGA设计实现的图像处理算法可以显著提升系统性能,更有利于实现便携式的处理模块,同时系统灵活,算法升级便捷。201410675063.7介绍了一种视频显著图提取方法,其根据解码得到的解码视频中的每帧解码帧中的每个子块的运动矢量和每个子块中的每个像素点的DCT系数,分别获得解码视频中的每帧解码帧的运动显著图和纹理显著图;然后根据解码视频中的每帧解码帧的纹理显著图。但是该算法实现复杂,所有图像数据处理均匀,实时性差。还有一种现有技术的显著区域确定算法,其首先通过对二维视频在时域上、在水平方向及在垂直方向进行采样,分别得到X-Y截面图像、X-T截面图像和Y-T截面图像,然后通过对X-T截面图像和Y-T截面图像进行低秩矩阵分解提取出X-Y截面图像的运动显著区域。但是该算法复杂,所有图像数据处理均匀,实时性差。公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
技术实现思路
本专利技术的目的在于提供一种基于多通道浅层特征的视频兴趣区域快速预选方法及系统,从而克服现有技术的所有图像数据处理均匀、实时性差的缺点。本专利技术提供了一种基于多通道浅层特征的视频兴趣区域快速预选方法,其特征在于,视频兴趣区域快速预选方法包括:读取视频数据流,并将视频数据流分解为RGB源尺寸图像;对RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及将第一判别值与第一存储值进行比较,得到第一差值,如果第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对图像块进行其它判别。优选地,上述技术方案中,如果第一差值小于预定门限,则继续执行以下步骤:将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;以及将帧的RGBY颜色空间的表征与合一化的帧信息共同作为帧信息的两种描述输出。优选地,上述技术方案中,视频兴趣区域快速预选方法还包括:基于合一化的帧信息计算像素密度显著值;基于帧的RGBY颜色空间的表征计算颜色显著值;基于帧的RGBY颜色空间的表征计算像素方位显著值;以及基于像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果。优选地,上述技术方案中,视频兴趣区域快速预选方法还包括:基于合一化的帧信息计算像素密度显著值包括:构建输入在nxn空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度值分布;基于帧的RGBY颜色空间的表征计算颜色显著值包括:将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布;基于帧的RGBY颜色空间的表征计算像素方位显著值包括:构建输入在nxn空间划分下的方位显著表征;以及将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。本专利技术还提供了一种基于多通道浅层特征的视频兴趣区域快速预选系统,包括:视频信息读入模块,其用于读取视频数据流,并将视频数据流分解为RGB源尺寸图像;RGB源尺寸图像处理模块,其用于对RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;判别值获得模块,其用于基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及快速判别模块,其用于将第一判别值与第一存储值进行比较,得到第一差值,如果第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对图像块进行其它判别。优选地,上述技术方案中,视频兴趣区域快速预选系统还包括:用于如果第一差值小于预定门限,则继续执行以下步骤的模块:将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;将帧的RGBY颜色空间的表征与合一化的帧信息共同作为帧信息的两种描述输出。优选地,上述技术方案中,视频兴趣区域快速预选系统还包括:像素密度显著值计算模块,其用于基于合一化的帧信息计算像素密度显著值;颜色显著值计算模块,其用于基于帧的RGBY颜色空间的表征计算颜色显著值;像素方位显著值计算模块,其用于基于帧的RGBY颜色空间的表征计算像素方位显著值;用于基于像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果的模块。优选地,上述技术方案中,基于合一化的帧信息计算像素密度显著值包括:构建输入在nxn空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度本文档来自技高网
...

【技术保护点】
1.一种基于多通道浅层特征的视频兴趣区域快速预选方法,其特征在于,所述视频兴趣区域快速预选方法包括:读取视频数据流,并将所述视频数据流分解为RGB源尺寸图像;对所述RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;基于所述三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及将所述第一判别值与第一存储值进行比较,得到第一差值,如果所述第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对所述图像块进行其它判别。

【技术特征摘要】
1.一种基于多通道浅层特征的视频兴趣区域快速预选方法,其特征在于,所述视频兴趣区域快速预选方法包括:读取视频数据流,并将所述视频数据流分解为RGB源尺寸图像;对所述RGB源尺寸图像进行处理,以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据;基于所述三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据,得到第一判别值;以及将所述第一判别值与第一存储值进行比较,得到第一差值,如果所述第一差值大于预定门限,则确定图像块为显著的图像块,并不再继续对所述图像块进行其它判别。2.根据权利要求1所述的视频兴趣区域快速预选方法,其特征在于,如果所述第一差值小于预定门限,则继续执行以下步骤:将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较,对低于对应门限的像素点数值更新为0,其他像素点取倒数;将分离的R、G、B三通道进行归一化,抑制高亮区域并补偿暗区域,得到归一化后的R、G、B三通道帧信息;通过非线性映射函数,将RGB空间图像映射为RGBY空间图像,获得帧在RGBY颜色空间的表征;以及将帧的RGBY颜色空间的表征与合一化的帧信息共同作为帧信息的两种描述输出。3.根据权利要求2所述的视频兴趣区域快速预选方法,其特征在于,所述视频兴趣区域快速预选方法还包括:基于所述合一化的帧信息计算像素密度显著值;基于所述帧的RGBY颜色空间的表征计算颜色显著值;基于所述帧的RGBY颜色空间的表征计算像素方位显著值;以及基于所述像素密度显著值、颜色显著值以及像素方位显著值,生成最终的兴趣区域和显著目标提取与定位结果。4.根据权利要求3所述的视频兴趣区域快速预选方法,其特征在于,所述视频兴趣区域快速预选方法还包括:所述基于所述合一化的帧信息计算像素密度显著值包括:构建输入在nxn空间划分下的表征;各个空间中获得像素的原始密度分布;将空间中的密度分布进行叠加平均,得到合一化帧的像素密度值分布;所述基于所述帧的RGBY颜色空间的表征计算颜色显著值包括:将数据由RGBY空间变换到HUE空间中,接着计算像素密度的显著值分布,得到颜色显著值分布;所述基于所述帧的RGBY颜色空间的表征计算像素方位显著值包括:构建输入在nxn空间划分下的方位显著表征;将所有的方位显著图进行叠加,即得到当前帧的像素方位显著值分布。5.一种基于多通道浅层特征的视频兴趣区域快速预选系统,其特征在于,所述视频兴趣区域快速预选系统包括:视频信息读入模块,其用于读取视频数据流,并将所述视频数据流分解为RGB源尺寸图像;RGB源尺寸图像...

【专利技术属性】
技术研发人员:王常勇周瑾张华亮韩久琦柯昂徐葛森
申请(专利权)人:中国人民解放军军事科学院军事医学研究院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1