当前位置: 首页 > 专利查询>中国人民解放军军事科学院军事医学研究院专利>正文

基于多通道浅层特征的视频兴趣区域快速预选方法及系统技术方案

技术编号：19328130 阅读：32 留言：0更新日期：2018-11-03 14:59

本发明专利技术公开了一种基于多通道浅层特征的视频兴趣区域快速预选方法，包括：读取视频数据流，并将视频数据流分解为RGB源尺寸图像；对RGB源尺寸图像进行处理，以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据；基于三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据，得到第一判别值；以及将第一判别值与第一存储值进行比较，得到第一差值，如果第一差值大于预定门限，则确定图像块为显著的图像块，并不再继续对图像块进行其它判别。本发明专利技术的视频兴趣区域快速预选方法能够满足目标识别区域的筛选功能，同时可以明显加速视频数据的处理速度。

Fast video preselection method and system based on multi-channel shallow features

The invention discloses a fast pre-selection method of video interest region based on multi-channel shallow feature, which includes: reading video data stream and decomposing video data stream into RGB source size image; processing RGB source size image to obtain the average value of three color channel data of each pixel and the number of red single channels. The first discriminant value is obtained based on the average value of the three color channel data, the red single channel data, the green single channel data and the blue single channel data, and the first discriminant value is compared with the first storage value to obtain the first difference, if the first difference is the first difference value. If the threshold is larger than the predetermined threshold, the image block is determined to be a significant image block, and no further discrimination is made on the image block. The fast pre-selection method of the video interest region of the present invention can satisfy the filtering function of the target recognition region, and can obviously accelerate the processing speed of the video data.

全部详细技术资料下载

【技术实现步骤摘要】
基于多通道浅层特征的视频兴趣区域快速预选方法及系统
本专利技术属于图像处理
，特别涉及一种基于多通道浅层特征的视频兴趣区域快速预选方法及系统。
技术介绍
随着光学、电子技术的不断发展，基于视频图像的技术方案在工业设计、家庭娱乐、交通监控等领域得到广泛应用。高性能的计算机处理器芯片、专用的GPU加速器、更高效的图像处理算法、强大的云计算平台使得图像内容检索、分析性能得到进一步的提升。视频显著区域提取是计算机图像智能识别、内容分析的重要步骤。计算机视频采集原始数据流具有体积大、冗余内容多、有效数据量小等特点，需要采用一定的预处理技术多兴趣目标范围进行快速甄别，区分背景区域，缩小检索的视野范围，为后继的目标识别算法进行初步的区域筛选，目前准确率较高的智能识别技术算法较复杂，处理时间较长，开发快速的显著区域提取技术有利于提高识别系统整体的实时性，减少处理时间，降低系统的整体功耗。目前已有多种基于软件算法的计算机视觉处理算法进行视频、图像中目标的提取、识别、跟踪，有基于像素点迁移的，这些软件算法已经广泛应用于人脸识别、车牌识别等领域，但是这些算法通常流程复杂，需要高性能的CPU和GPU配置的硬件平台支持，算法实时性较差，同时这些算法对图片中目标的条件有限制，需要目标物理位置、势态角度、运行速度以及拍摄曝光强度等在可处理的范围内，通用的软件算法不满足高分辨率、大广角、实时性强、可便携的视频图像设备处理要求。FPGA(Field－ProgrammableGateArray)，现场可编程门阵列，它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的技术。与专...

【技术保护点】
1.一种基于多通道浅层特征的视频兴趣区域快速预选方法，其特征在于，所述视频兴趣区域快速预选方法包括：读取视频数据流，并将所述视频数据流分解为RGB源尺寸图像；对所述RGB源尺寸图像进行处理，以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据；基于所述三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据，得到第一判别值；以及将所述第一判别值与第一存储值进行比较，得到第一差值，如果所述第一差值大于预定门限，则确定图像块为显著的图像块，并不再继续对所述图像块进行其它判别。

【技术特征摘要】
1.一种基于多通道浅层特征的视频兴趣区域快速预选方法，其特征在于，所述视频兴趣区域快速预选方法包括：读取视频数据流，并将所述视频数据流分解为RGB源尺寸图像；对所述RGB源尺寸图像进行处理，以获得各个像素点的三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据；基于所述三路颜色通道数据的平均值、红色单通道数据、绿色单通道数据以及蓝色单通道数据，得到第一判别值；以及将所述第一判别值与第一存储值进行比较，得到第一差值，如果所述第一差值大于预定门限，则确定图像块为显著的图像块，并不再继续对所述图像块进行其它判别。2.根据权利要求1所述的视频兴趣区域快速预选方法，其特征在于，如果所述第一差值小于预定门限，则继续执行以下步骤：将输入的视频帧中的分离的R、G、B通道像素点与各自对应门限像素点进行比较，对低于对应门限的像素点数值更新为0，其他像素点取倒数；将分离的R、G、B三通道进行归一化，抑制高亮区域并补偿暗区域，得到归一化后的R、G、B三通道帧信息；通过非线性映射函数，将RGB空间图像映射为RGBY空间图像，获得帧在RGBY颜色空间的表征；以及将帧的RGBY颜色空间的表征与合一化的帧信息共同作为帧信息的两种描述输出。3.根据权利要求2所述的视频兴趣区域快速预选方法，其特征在于，所述视频兴趣区域快速预选方法还包括：基于所述合一化的帧信息计算像素密度显著值；基于所述帧的RGBY颜色空间的表征计算颜色显著值；基于所述帧的RGBY颜色空间的表征计算像素方位显著值；以及基于所述像素密度显著值、颜色显著值以及像素方位显著值，生成最终的兴趣区域和显著目标提取与定位结果。4.根据权利要求3所述的视频兴趣区域快速预选方法，其特征在于，所述视频兴趣区域快速预选方法还包括：所述基于所述合一化的帧信息计算像素密度显著值包括：构建输入在nxn空间划分下的表征；各个空间中获得像素的原始密度分布；将空间中的密度分布进行叠加平均，得到合一化帧的像素密度值分布；所述基于所述帧的RGBY颜色空间的表征计算颜色显著值包括：将数据由RGBY空间变换到HUE空间中，接着计算像素密度的显著值分布，得到颜色显著值分布；所述基于所述帧的RGBY颜色空间的表征计算像素方位显著值包括：构建输入在nxn空间划分下的方位显著表征；将所有的方位显著图进行叠加，即得到当前帧的像素方位显著值分布。5.一种基于多通道浅层特征的视频兴趣区域快速预选系统，其特征在于，所述视频兴趣区域快速预选系统包括：视频信息读入模块，其用于读取视频数据流，并将所述视频数据流分解为RGB源尺寸图像；RGB源尺寸图像...

【专利技术属性】
技术研发人员：王常勇，周瑾，张华亮，韩久琦，柯昂，徐葛森，
申请(专利权)人：中国人民解放军军事科学院军事医学研究院，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人