一种时空域显著性检测及融合方法技术

技术编号：20730218 阅读：55 留言：0更新日期：2019-03-30 19:36

本发明专利技术公开了一种时空域显著性检测及融合方法，利用卷积神经网络对输入视频帧进行空域显著性检测，同时根据HEVC压缩过程中帧间预测过程得到的运动矢量，生成时域部分的运动显著性结果，采用熵不确定度的方法对时空域显著性进行融合，从而得到针对视频的时空域显著性结果；该方法可有效结合时空域信息得到较准确的时空显著图，为后续视频压缩提供了有力的保障。

全部详细技术资料下载

【技术实现步骤摘要】
一种时空域显著性检测及融合方法
本专利技术涉及视频
，更具体的说是涉及一种时空域显著性检测及融合方法，该方法基于卷积神经网络和运动矢量的时空域显著性检测及融合。
技术介绍
目前，随着视频压缩技术的不断发展、高品质、高实时性视频已成为发展趋势，这也促进了高清、超高清视频应用的迅速发展。目前，新一代视频编码标准HEVC(HighEfficiencyVideoCoding)在保留了传统视频编码的框架基础上，采纳近年来视频压缩技术研究的新成果，使其编码性能基本可以达到H.264/AVC标准的2倍。然而，这种压缩性能的提高也带来了巨大的编码复杂度，仍需要进行进一步的研究和改进。同时，随着视频分辨率和质量的提高，现代社会对视频高清度的要求也越来越高，由最初的QCIF发展至4K(分辨率为3840×2160)，乃至不久后发展为8K(分辨率为7680×4320)的超高清视频，这样对视频的压缩、存储和传输都提出了更高的要求。在高清视频应用越来越普及的情况下，因为带宽受限而出现的问题给视频压缩技术带来了巨大的挑战，如何保证高质量的高清视频传输、提升人眼的主观视觉感受质量己经成为刻不容缓需要解决的问题，尤其是如何能够提高压缩效率，使人眼所关注部分的画质更加清晰、真实等至关重要。视频压缩的编码效率是通过减少统计冗余和感知冗余来实现的。在标准的视频压缩方法中，去除统计冗余作为核心技术，包括帧内预测，帧间预测，熵编码等等，去除感知冗余的技术主要包括量化矩阵中衰减高频分量，色度亚采样，去块滤波等。然而，对于人类视觉系统(HVS)的研究发现，人类通常只能清楚地看到视角2-5°内的小区...

【技术保护点】
1.一种时空域显著性检测及融合方法，其特征在于，包括：输入原始视频帧，根据卷积神经网络对输入视频帧进行空域显著性检测，生成空域显著性检测结果；根据HEVC压缩过程中帧间预测过程得到的运动矢量，生成时域部分的运动显著性结果；将所述空域显著性检测结果和所述时域部分的运动显著性结果，采用熵不确定度算法进行融合。

【技术特征摘要】
1.一种时空域显著性检测及融合方法，其特征在于，包括：输入原始视频帧，根据卷积神经网络对输入视频帧进行空域显著性检测，生成空域显著性检测结果；根据HEVC压缩过程中帧间预测过程得到的运动矢量，生成时域部分的运动显著性结果；将所述空域显著性检测结果和所述时域部分的运动显著性结果，采用熵不确定度算法进行融合。2.根据权利要求1所述的一种时空域显著性检测及融合方法，其特征在于，所述卷积神经网络结构，包括：(1)卷积层：经过卷积操作后得到表示图像局部特征的特征图，每个卷积层后加一个修正线性单元；(2)局部响应归一化层：对神经网络中间层的输出进行了平滑，输出如下：其中(x,y)表示像素位置，i表示通道索引，N为通道数，α,β,k,n均为自定义常数；l表示在第l个局部响应归一化层；j表示通道索引；(3)最大池化层：最大池化层用于提取局部相近的语义信息，该过程通过一个N×N的滑动窗口操作，其中窗口移动步长为N，通过计算原图像的局部被窗口所包含区域的最大值作为新的特征图对应位置的像素值；(4)反卷积层：实现将小尺寸的特征图尺寸缩放为原图像的大小，得到最终输出。3.根据权利要求2所述的一种时空域显著性检测及融合方法，其特征在于，根据卷积神经网络对输入视频帧进行空域显著性检测，生成空域显著性检测结果，包括：将所述卷积神经网络训练完成后，对输入的所述原始视频帧图像进行前向传播，得到最终的空域显著性图。4.根据权利要求3所述的一种时空域显著性检测及融合方法，其特征在于，根据HEVC压缩过程中帧间预测过程得...

【专利技术属性】
技术研发人员：祝世平，刘畅，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人