一种面向实时视频分析的画面增强型解码方法技术

技术编号：36926360 阅读：9 留言：0更新日期：2023-03-22 18:49

本发明专利技术公开了一种面向实时视频分析的画面增强型解码方法，包括如下步骤：视频码流通过网络传输到服务器后由调度器将所有帧分成三类，每个类别执行三个管道中的一个。三个管道包括1.利用超分辨率模型将一组低分辨率锚点帧增强为高分辨率帧后输入推理模型；2.利用码流信息(如帧参考关系、运动向量和残差)将锚点帧的增益扩散到非锚点帧上并将所述非锚点帧输入推理模型；3.利用码流信息运动向量将推理模型的结果复用到未推理帧上。调度器利用从关键帧提取的画面特征和从码流信息中提取的帧差异特征进行合理的帧分类；画面增强提升了视频分析的推理精度，而码流信息的使用避免了对整个视频进行逐帧画面增强和推理，降低了时延。延。延。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向实时视频分析的画面增强型解码方法

[0001]本专利技术涉及视频分析领域，具体而言涉及一种面向实时视频分析的画面增强型解码方法。

技术介绍

[0002]随着计算机视觉的进步，如今普及的摄像头所拍摄的视频都有机会进行自主分析。深度神经网络可以显著提高各种视觉任务的准确性，但对计算资源的要求很高。由于商业摄像头的计算资源不足，分布式视频分析管道(Video Analytics Pipeline,VAP)会将视频传输到功能强大的服务器上进行推理。
[0003]然而，即使是最先进的分布式VAP，也难以做到对视频的高度精确的分析。由于目前绝大多数的视频分析方法都依赖于高分辨率的视频，因此很难分析低质量的视频，比如在低分辨率下的目标检测。例如，Faster R
‑
CNN是基于现代深度神经网络(Deep Neural Network,DNN)的推理方法，该方法的准确率对于360p的视频只能达到56％左右，对于540p的视频只能达到61％左右。然而，现有的监控系统不可避免地会收集到低质量的视频。其中一个原因是，现有的低质量的摄像头只能收集低分辨率帧。例如，纽约市的交通部门已经将752个交通摄像头收集的视频公开；然而，由于摄像头的默认配置，这些视频以极低的分辨率(240p)传输。另一个原因是，由于上游带宽的限制，目前的视频流协议会过度压缩或修剪视频。例如，AWStream为了节省带宽，会将视频的分辨率从540p降低到360p，帧率从1降低到0.83。AWStream最终节省了66％的带宽，却将精度从6...

【技术保护点】

【技术特征摘要】
1.一种面向实时视频分析的画面增强型解码方法，包括如下步骤：(1)视频码流通过网络传输到服务器后由调度器将所有帧分成三类，每个类别执行三个管道中的一个；(2)第一管道利用超分辨率模型将一组低分辨率锚点帧增强为高分辨率帧后输入推理模型；第二管道利用码流信息将锚点帧的增益扩散到非锚点帧上并将所述非锚点帧输入推理模型；(3)第三管道利用码流信息运动向量将推理模型的结果复用到未推理帧上。2.根据权利要求1所述一种面向实时视频分析的画面增强型解码方法，其特征在于：所述步骤(1)中，调度器提供自适应的阈值设置，来决定将帧分类到哪个管道；为了自适应地设置阈值，将上述问题表述为一个马尔科夫决策过程，其中调度器在系统中作出阈值设置决策；马尔科夫决策过程是一个离散时间的随机过程，定义为一个四元组<S,A,R,P>；其中S是状态集合，A是动作集合，R是奖励集合，P是动作A发生时，从状态S转换到状态S
′
的概率；当处理帧时，调度器的目标是将这些帧聚类到三个管道来最大化预期的长期奖励状态由两个组成部分组成：关键帧的内容特征以及当前帧与最后一个推理帧之间的差异；动作是为每个视频段设置两个阈值tr1和tr2：...

【专利技术属性】
技术研发人员：戴海鹏，王蔚峻，厉泉宏，米良，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人