【技术实现步骤摘要】
用于算网融合环境中面向实时视频流应用的推断加速方法
[0001]本专利技术涉及边缘计算和深度学习领域,具体地说是一种用于算网融合环境中面向实时视频流应用的推断加速方法。
技术介绍
[0002]随着高清摄像头和高清屏幕等多媒体设备的不断普及,人们对实时视频流应用的清晰度要求越来越高。然而,由于网络边缘侧和核心侧基础设施建设的差异,核心网络越来越难以承受大量高清实时视频流用户带来的压力,进而催生了以超分辨率为代表的利用终端计算能力提升视频清晰度的技术。随着5G等移动通信技术的高速发展,越来越多的用户开始在移动终端上观看实时视频流,在移动终端上运行实时视频流超分辨率应用已成为必然趋势。超分辨率技术为视频传输的过程增加了一个计算步骤,即利用客户端的计算能力提升视频的画质,使得客户端只需要接收低清晰度的视频流就能为用户呈现高清晰度的视频内容,从而将视频传输的压力部分转移为了客户端设备的计算压力。然而,超分辨率技术所使用的深度学习模型通常计算量较大,移动设备上有限的计算资源很难在保证输出视频质量的情况下支持超分辨率模型实时运行。设备计算资源受限问题在视频超分辨率等深度学习应用中普遍存在,是阻碍深度学习技术实现移动终端智能化的主要障碍之一。
[0003]在实际情况下,实时视频传输应用中的数据流通常是从云数据中心发出,经过广域网到达终端侧。而随着NFV等虚拟化技术的发展和网络基础设施的不断完善,广域网中逐渐产生了大量的冗余算力。基于此,为解决类似的广域网应用所面临的计算障碍,学术界和工业界提出一种支持终端智能服务的新型计算范 ...
【技术保护点】
【技术特征摘要】
1.一种用于算网融合环境中面向实时视频流应用的推断加速方法,其特征在于:该方法利用算网融合环境中各层不同的计算能力与网络链路特性,构建面向实时视频流应用的超分辨率推断执行框架,并通过不断对网络状况及相关系统参数进行采集分析,完成对计算过程的动态调节;该方法包括以下步骤:步骤1)利用多尺度特征提取的思想对深度神经网络模型进行改造,并合理划分多个分块;步骤2)基于步骤1)构建面向实时视频流应用的超分辨率推断执行框架;具体有:框架将深度神经网络模型分块分布式地部署在算网融合环境中不同的位置,能动态决定推断序列长度和吞吐量,以控制实现计算过程的动态调节;步骤3)基于步骤2)所构建的超分辨率推断执行框架,采集系统中的相关数据并分析相应的特征,具体包括:算网融合环境下当前网络传输能力特征、超分辨率多尺度特征提取模型的中间数据特征、压缩视频流的数据特征;步骤4)根据历史数据对步骤1)中的超分辨率模型和步骤2)中推断执行框架的计算过程进行建模,得到超分辨率推断执行框架的各部分在不同特征参数下的推断时延期望值;将步骤3)中所得到的特征数据作为输入参数,进一步分析得到任务在不同序列长度下端到端时延的期望值,构建端到端时延的估算模型作为优化限制条件;步骤5)根据历史数据统计步骤1)中的超分辨率模型在不同特征参数下的推断视频质量期望值,构建视频质量的估算函数,以最大化视频质量为优化目标;在步骤4)中所得到的构建端到端时延限制条件下,对视频质量最大化模型的解空间进行搜索,得到最优超分辨率推断执行方案,进而在满足实时性限制的条件下获得较高的视频质量。2.根据权利要求1所述的用于算网融合环境中面向实时视频流应用的推断加速方法,其特征在于:所述步骤1)中,对于面向实时视频流应用的超分辨率推断执行框架的构建,根据超分辨率深度神经网络的结构特点将其划分为多个相互独立的多尺度分支分块和聚合分块;多尺度分块互相之间无数据依赖而独立运行,聚合分块依赖各多尺度分块所输出的数据;步骤1)包括以下步骤:步骤101)解开超分辨率模型中的多尺度特征提取结构的数据依赖,根据超分辨率模型中的数据流动路径取出超分辨率模型分块组成分支结构,使得每个尺度的特征都由独立分支计算得来,而剩余部分作为聚合分块聚合各多尺度分块所输出的数据;步骤102)对于所述步骤101)中得到的解开了多尺度特征提取结构数据依赖的超分辨率模型,对其在解开依赖时各分支中的重复分块进行裁剪,使得各分支在相同设备上都具有相近的时延;步骤103)在数据集上对所述步骤102)中的模型进行训练,得到优化后的具有较高精度的超分辨率模型。3.根据权利要求1所述的用于算网融合环境中面向实时视频流应用的推断加速方法,其特征在于:所述步骤2)对步骤1)所获得的模型进行部署并为步骤5)的提供对推断过程进行控制的手段;步骤2)包括以下步骤:步骤201)对步骤1)中所得到的超分辨率模型,将其多尺度特征提取分支和聚合分块打包为多个可独立部署的部件,并部署于多个计算设备上;步骤202)各个多尺度特征提取分支分块所在设备接收低清视频流,以指定帧序列长度
和吞吐量运行分块对视频流进行处理,并将结果发送给聚合分块所在设备;步骤203)聚合分块所在设备接收来自分支分块的计算结果,运行聚合分块对接收数据进一步推断;将结果输出给终端设备。4.根据权利要求1所述的用于算网融合环境中面向实时视频流应用的推断加速方法,其特征在于:所述步骤3)用于采集步骤4)建模和步骤5)分析所需参数;步骤3)包括以下步骤:步骤301)根据算网融合环境下的历史日志数据,分析超分辨率模型输出视频质量与帧序列长度,压缩视频包大小,压缩视频内运动矢量量级和残差数据量大小等特征间的关系,得到视频质量Q关于帧序列长度w和压缩视频特征f之间的关系;步骤302)获取各计算设备CPU性能,内存容量,磁盘大小等数据特征,结合历史数据特征,计算在不同帧序列长度w下模型各分块在各个计算设备上的平...
【专利技术属性】
技术研发人员:东方,尹达恒,沈典,郭晓琳,罗军舟,
申请(专利权)人:东南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。