基于端云协同的实时超分视频流传输优化方法技术

技术编号:37819184 阅读:10 留言:0更新日期:2023-06-09 09:51
本发明专利技术基于端云协同的实时超分视频流传输优化方法,包括:S1:采集环境

【技术实现步骤摘要】
基于端云协同的实时超分视频流传输优化方法


[0001]本专利技术涉及网络传输
,特别涉及基于端云协同的实时超分视频流传输优化方法。

技术介绍

[0002]随着互联网信息时代的快速发展和网络基础设施的升级更新,实时视频流应用迅速普及发展,用户对于视频流服务的质量期望也有了更高要求。然而,现如今在视频流服务上仍存在因不稳定的网络状态、较短的客户端缓存等问题导致的用户观看体验质量下降痛点,稳定高效的实时视频流传输技术对改善实时视频流服务质量具有重要意义。
[0003]目前的实时视频流传输技术方案主要集中于设计码率自适应控制算法,可依然存在着许多不足之处:其一,规则人工设计与制定,在实时视频流低延迟要求的情况下,常会导致视频播放器缓冲区较小,难以及时响应动态复杂的网络环境;其二,更多侧重于视频码率本身的控制,忽略了端侧计算资源的利用。
[0004]因此,如何从底层技术方面解决这些问题,设计稳定高效的实时视频流传输优化方法,是本
内研究人员亟需解决的问题。

技术实现思路

[0005]本专利技术的目的在于提供基于端云协同的实时超分视频流传输优化方法,实现了复杂网络环境的动态自适应,充分利用了端侧的计算资源,可以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:
[0007]基于端云协同的实时超分视频流传输优化方法,包括如下步骤:
[0008]S1:采集环境

智能体状态观测值作为训练数据集D,包括客户端播放状态数据和网络环境状态数据;
[0009]S2:先将强化学习网络模型Q初始化,然后随机从步骤S1所述训练数据集D采样进行迭代训练,结合实时视频流用户体验质量QoE模型作为奖励函数r
i
,在不断的强化学习交互试错训练过程中获得最优网络模型,从而在真实应用场景中得到最优码率决策;
[0010]S3:根据S2中得出的最优码率决策,请求对应的视频分块文件至客户端待超分重建缓冲区内,通过超分重建调度机制来判断该缓冲区内的视频分块文件是否需要进行重建以及超分重建程度,然后将该缓冲区内的待重建视频分块文件传入离线训练好的超分重建网络模型中,根据预先计算设置好的重建程度即超分比例来进行视频画质超分重建过程,最后将重建完成的视频文件重新放入到播放缓冲区中,等待被渲染呈现在屏幕上。
[0011]本专利技术进一步的改进在于,步骤S1中,客户端播放状态数据包括当前缓冲区占用率b
i
、历史视频分块下载时间列表请求的视频分块码率列表和上一个视频分块被下载的码率d
i
‑1。
[0012]本专利技术进一步的改进在于,步骤S1中,网络环境状态数据包括当前实时延迟l
i

历史视频分块吞吐率列表
[0013]本专利技术进一步的改进在于,步骤S2中的奖励函数r
i
也即用户体验质量QoE模型表示为:
[0014][0015]式中,n为视频分块索引,N为视频分块总数,R
n
为视频分块n的码率,q(R
n
)为将视频码率映射到用户所感知的质量,T
n
为以选定码率下载视频分块n而导致的卡顿时间,L
n
为当前实时延迟,S
n
为当前跳过下载的视频分块个数,α为视频质量奖励因子,β为卡顿惩罚因子,η为实时延迟惩罚因子,σ为跳过下载惩罚因子,μ为码率切换惩罚因子。
[0016]本专利技术进一步的改进在于,S2具体包括以下步骤:
[0017]步骤S201:首先将Q网络的参数梯度值进行重置,并初始化Q网络的模型参数;
[0018]步骤S202:随机从步骤S1中所述的训练数据集D中采样当前状态作为初始化数据来对Q网络进行迭代初始化,接着启动实施视频流会话进程,利用Q网络进行数据处理,输出一个对应的码率概率分布π
θ
(s
i
,a
i
)∈[0,1],从而获得码率决策a
i
;然后和当前播放器环境进行交互,获取当前动作行为的奖励值r
i
,并转移到下一个状态
[0019]步骤S203:当会话结束后,使用累计梯度值去更新本地网络模型的参数,然后不断重复步骤S202,直至网络模型的奖励函数值r
i
不再增加;
[0020]步骤S204:根据训练过程中获得的最优网络模型,从而在真实应用场景中得到最优码率决策。
[0021]本专利技术进一步的改进在于,S3具体包括以下步骤:
[0022]步骤S301:根据步骤2中得出的最优码率决策,客户端请求对应的视频分块文件至客户端超分重建缓冲区内,等待超分重建器来判断是否进行重建工作;
[0023]步骤S302:通过输入客户端设备的计算能力信息、缓冲区状态以及待重建视频分辨率信息,超分重建控制器会预测超分重建时间,从而选择重建分辨率决策值;然后根据当前设备计算能力值进行比较来获取其重建时间;
[0024]步骤S303:根据步骤S302的目标分辨率决策结果利用实时超分网络模型进行超分重建,将超分重建之后的视频分块放入待播放缓冲区,完成整个超分重建过程。
[0025]本专利技术进一步的改进在于,步骤S302中,关于如何预测超分重建时间,是通过离线计算一个基础设备的所有推理时间作为基准。
[0026]本专利技术进一步的改进在于,步骤S302中,当前客户端设备重建时间ψ
i
为:
[0027][0028]式中,ψ
i
表示当前客户端设备重建时间,表示基准设备的标准重建时间,表示初始视频分块分辨率,表示目标重建分辨率,μ为当前客户端设备计算能力,为基准测试设备的计算能力。
[0029]与现有技术相比,本专利技术至少具有如下有益的技术效果:
[0030]本专利技术公开了基于端云协同的实时超分视频流传输优化方法,包括采集环境

智能体(Env

Agent)状态观测值作为训练数据集D,即客户端播放状态数据和网络环境状态数据;网络随机从训练数据集D采样,并基于交互数据以深度强化学习的方式获得最优码率决策网络模型,从而在真实应用场景中得到最优码率决策;然后根据得出的最优码率决策,请求对应的视频分块文件至客户端待超分重建缓冲区内,通过超分重建调度机制来进行视频分块文件的超分重建工作,最后将视频渲染呈现在屏幕上。本专利技术提供的基于端云协同的实时超分视频流传输优化方法,实现了复杂网络环境的动态自适应,充分利用了端侧的计算资源。
附图说明
[0031]图1为完整的真实网络环境中传输实时视频流模拟系统架构图(核心采用本方法);
[0032]图2为完整的基于端云协同的实时超分视频流传输优化方法;
[0033]图3为深度强化学习A3C网络模型;
[0034]图4为实时超分重建方法框架。
具体实施方式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于端云协同的实时超分视频流传输优化方法,其特征在于,包括如下步骤:S1:采集环境

智能体状态观测值作为训练数据集D,包括客户端播放状态数据和网络环境状态数据;S2:先将强化学习网络模型Q初始化,然后随机从步骤S1所述训练数据集D采样进行迭代训练,结合实时视频流用户体验质量QoE模型作为奖励函数r
i
,在不断的强化学习交互试错训练过程中获得最优网络模型,从而在真实应用场景中得到最优码率决策;S3:根据S2中得出的最优码率决策,请求对应的视频分块文件至客户端待超分重建缓冲区内,通过超分重建调度机制来判断该缓冲区内的视频分块文件是否需要进行重建以及超分重建程度,然后将该缓冲区内的待重建视频分块文件传入离线训练好的超分重建网络模型中,根据预先计算设置好的重建程度即超分比例来进行视频画质超分重建过程,最后将重建完成的视频文件重新放入到播放缓冲区中,等待被渲染呈现在屏幕上。2.根据权利要求1所述的基于端云协同的实时超分视频流传输优化方法,其特征在于,步骤S1中,客户端播放状态数据包括当前缓冲区占用率b
i
、历史视频分块下载时间列表请求的视频分块码率列表和上一个视频分块被下载的码率d
i
‑1。3.根据权利要求1所述的基于端云协同的实时超分视频流传输优化方法,其特征在于,步骤S1中,网络环境状态数据包括当前实时延迟l
i
和历史视频分块吞吐率列表4.根据权利要求1所述的基于端云协同的实时超分视频流传输优化方法,其特征在于,步骤S2中的奖励函数r
i
也即用户体验质量QoE模型表示为:式中,n为视频分块索引,N为视频分块总数,R
n
为视频分块n的码率,q(R
n
)为将视频码率映射到用户所感知的质量,T
n
为以选定码率下载视频分块n而导致的卡顿时间,L
n
为当前实时延迟,S
n
为当前跳过下载的视频分块个数,α为视频质量奖励因子,β为卡顿惩罚因子,η为实时延迟惩罚因子,σ为跳过下载惩罚因子,μ为码率切换惩罚因子。5.根据权利要求1所述的基于端云协同的实时超...

【专利技术属性】
技术研发人员:杨树森王世博林雪余栗海亮赵鹏苏海容吴文昊华润森
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1