当前位置: 首页 > 专利查询>浙江大学专利>正文

一种视频传输方法及装置制造方法及图纸

技术编号:38339471 阅读:14 留言:0更新日期:2023-08-02 09:20
本发明专利技术公开了一种视频传输方法及装置,其中,视频传输方法包括:获取待传输视频;切分待传输视频为不同码率和分辨率的相同时长的子视频片段;收集子视频片段相关信息特征和视频传输时的网络状态指标、客户端状态指标;基于子视频段预测网络得到待传输子视频片段的级别;传输选定级别的子视频片段到客户端,并将子视频信息存入待播放缓存中。本发明专利技术提出的视频传输方法及装置能够自适应地选择被传输的子视频片段,在保证主观质量的前提下,减少视频卡顿的时长和频率,降低了相关技术中子视频片段频繁切换带来的视觉疲劳频次。片段频繁切换带来的视觉疲劳频次。片段频繁切换带来的视觉疲劳频次。

【技术实现步骤摘要】
一种视频传输方法及装置


[0001]本专利技术涉及视频传输
,具体涉及一种视频传输方法及装置。

技术介绍

[0002]随着5G和Wi

Fi技术的发展和智能手机、智能手表、平板电脑等移动手持设备的普及,流媒体流量和移动视频流应用的数量也在快速增长。由于客户端网络状态的差异性和移动网络的不稳定性,用户在观看视频过程中既有高清视频需求又希望减少视频卡顿的时长。在现有的视频传输中,用户对视频播放的体验质量由三部分构成,分别是视频质量、视频卡顿的时长和视频级别切换带来的视觉疲劳。在点播的应用场景下,传统的视频传输控制算法(1)未考虑视频编码过程中码率和视频的客观评价质量之间存在边际递减效应(2)未考虑视频卡顿频率的情况对用户的负面影响(3)未考虑视频的切换过程中不同级别切换方向对用户的影响。
[0003]在视频编码的过程中,视频编码后的码率越高,视频的客观评价指标及主观评价指标都随之提高。但是当视频码率增长到一定程度时,视频码率增长带来的视觉观感效益的提升将减小。现有的分析方法Pensieve/Robust MPC等都存在相似的问题,由于视频的客观及主观评价指标不再随码率增长明显提升,用视频的码率来代表用户观看的视频质量不再合理。
[0004]在现有的视频传输控制算法中,视频的卡顿时长与视频切换后带来的视觉疲劳也是衡量算法优劣的标准。但是在视频播放的过程中,除了视频的长时间卡顿会对用户带来困扰,视频的卡顿频次也会给客户带来苦恼,例如一段5分钟的视频中途一次性卡顿了1分钟与24秒的视频每次卡顿1秒总共卡顿了20次是同样令人讨厌的,因此卡顿频次与卡顿时长对用户观看视频的观感同样的重要,现有的分析方法QARC/Pensieve/BB等都存在相似的问题。
[0005]除此以外,所谓切换过程中不同级别切换方向的衡量标准在传统视频传输控制算法中是切换后的视频码率与切换前的视频码率之间差的绝对值。但是这样会带来两个问题:1)从码率的角度来说,无论当前算法选择的是向低码率切换还是向高码率切换所认为带来的视觉疲劳程度是一致的,如1750kbps/s码率视频向上切换为2750kbps/s码率视频和1750kbps/s码率视频向下切换为750kbps/s码率视频所认为的视觉疲惫一致,但是为了确保视频高清,应该在视频不卡顿的情况下抑制算法选择向下切换的频率。2)未考虑到码率和视频评价指标之间的边际递减效应对切换过程的影响。如图1所示,当3500kbps/s的视频分别切换向2500kbps/s和4500kbps/s的视频时,主观评价指标Vmaf分数的变化相对1500kbps/s的视频分别切换向2500kbps/s和500kbps/s的视频的主观评价指标Vmaf分数的变化更小,但是在传统的码率传输控制算法中对两种切换衡量的视觉疲劳是一样的。现有的分析方法分析方法QARC/FESTIVE等都存在相似的问题,因此需要对卡顿情况以及切换过程中不同级别切换方向的衡量标准进行修改,使之更加合理地贴近用户的观看体验感受。

技术实现思路

[0006]本专利技术为了克服以上技术的不足,提供了一种可以自适应选择被传输的子视频片段,在点播环境下,提高视频质量,减少视频卡顿的时长和频率,缓解切换带来的视觉疲劳的视频传输方法及装置,以提升视频播放中的用户体验。
[0007]本专利技术克服其技术问题所采用的技术方案是:
[0008]一种视频传输方法,包括以下步骤:
[0009]获取待传输视频;
[0010]切分待传输视频为不同码率和分辨率的相同时长的子视频片段;
[0011]收集子视频片段相关信息特征和视频传输时的网络状态指标、客户端状态指标;
[0012]基于子视频段预测网络得到待传输子视频片段的级别;
[0013]传输选定级别的子视频片段到客户端,并将子视频信息存入待播放缓存中。
[0014]进一步的,切分待传输视频为不同码率和分辨率的相同时长的子视频片段,包括:
[0015]将待传输视频的原始yuv文件基于预设时长和帧率拆分为多组相同长度的帧文件;
[0016]采用编码器基于预设码率和分辨率对每组相同长度的帧文件进行视频编码,得到相同时长的子视频片段。
[0017]进一步的,收集子视频片段相关信息特征包括:
[0018]测量各个所述相同时长的子视频片段的文件大小;
[0019]计算各个所述相同时长的子视频片段的客观评价指标分数;
[0020]获取各个所述相同时长的子视频片段的视频帧之间的的时间信息和视频帧的空间信息。
[0021]进一步的,所述视频传输时的网络状态指标包括所选子视频片段下载所需的时间和网络吞吐量,每次视频传输完成后,根据当前选择的子视频片段文件大小和测量得到的该子视频片段下载所需的时间计算出上一个视频传输过程中的网络吞吐量情况;
[0022]所述客户端状态指标包括用户观看视频过程中的卡顿时长、卡顿计数次数和待播放的视频缓存时间,所述卡顿计数次数测量获取,卡顿时长与待播放的视频缓存时间根据子视频片段的下载时间与原待播放视频缓存时间计算得到。
[0023]进一步的,所述子视频段预测网络包括行动者策略网络和评判者价值网络,所述行动者网络用于预测选择各个级别子视频片段的概率,所述评判者网络用于预测在当前状态下的价值;所述子视频段预测网络的训练过程包括:
[0024]在每一轮的学习中,代理者根据当前环境状态通过行动者策略网络选择当前概率最大的动作,待动作完成后环境状态更新,同时计算出上一次选择得到的奖励,并且将奖励作为反馈信号用TD算法更新所述评判者价值网络的权重参数,评判者网络对当前策略的值函数进行估计,评估行动者策略的优劣,并更新行动者策略网络的参数,完成一次学习;
[0025]将验证集输入更新后的行动者策略网络中,计算选择得到的奖励;
[0026]重复上述步骤,直至所述验证集的奖励不再提高,得到训练完成的子视频段预测网络。
[0027]进一步的,用于计算奖励的奖励函数为:
[0028][0029]其中,系数γ、系数η、系数λ是用户偏好权重,k表示传输成功的第k段视频,vq
k,vmaf
表示第k段视频的客观质量,具体的用VMAF分数指示,f
k
表示该视频从第一段视频到第k段视频下载过程中的卡顿次数,表示播放视频时的卡顿时长,br
k
表示第k段视频的比特率大小。
[0030]进一步的,基于子视频段预测网络得到待传输子视频片段的级别,包括:
[0031]将子视频片段相关信息特征和视频传输时的网络状态、客户端状态作为环境状态;
[0032]通过行动者策略网络选择在相应环境状态下概率最大的动作,进而选定待传输的子视频片段。
[0033]进一步的,传输选定级别的子视频片段到客户端,并将子视频信息存入待播放缓存中包括:
[0034]从服务端向客户端传输行动者策略网络选择的子视频片段;将最新本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频传输方法,其特征在于,包括以下步骤:获取待传输视频;切分待传输视频为不同码率和分辨率的相同时长的子视频片段;收集子视频片段相关信息特征和视频传输时的网络状态指标、客户端状态指标;基于子视频段预测网络得到待传输子视频片段的级别;传输选定级别的子视频片段到客户端,并将子视频信息存入待播放缓存中。2.根据权利要求1所述的视频传输方法,其特征在于,切分待传输视频为不同码率和分辨率的相同时长的子视频片段,包括:将待传输视频的原始yuv文件基于预设时长和帧率拆分为多组相同长度的帧文件;采用编码器基于预设码率和分辨率对每组相同长度的帧文件进行视频编码,得到相同时长的子视频片段。3.根据权利要求1所述的视频传输方法,其特征在于,收集子视频片段相关信息特征包括:测量各个所述相同时长的子视频片段的文件大小;计算各个所述相同时长的子视频片段的客观评价指标分数;获取各个所述相同时长的子视频片段的视频帧之间的的时间信息和视频帧的空间信息。4.根据权利要求1所述的视频传输方法,其特征在于,所述视频传输时的网络状态指标包括所选子视频片段下载所需的时间和网络吞吐量,每次视频传输完成后,根据当前选择的子视频片段文件大小和测量得到的该子视频片段下载所需的时间计算出上一个视频传输过程中的网络吞吐量情况;所述客户端状态指标包括用户观看视频过程中的卡顿时长、卡顿计数次数和待播放的视频缓存时间,所述卡顿计数次数测量获取,卡顿时长与待播放的视频缓存时间根据子视频片段的下载时间与原待播放视频缓存时间计算得到。5.根据权利要求1

4任一项所述的视频传输方法,其特征在于,所述子视频段预测网络包括行动者策略网络和评判者价值网络,所述行动者网络用于预测选择各个级别子视频片段的概率,所述评判者网络用于预测在当前状态下的价值;所述子视频段预测网络的训练过程包括:在每一轮的学习中,代理者根据当前环境状态通过行动者策略网络选择当前概率最大的动作,待动作完成后环境状态更新,同时计算出上一次选择得到的奖励,并且将奖励作为反馈信号用TD算法更新所述评判者价值网络的权重参数,评判者网络对当前策略的值函数进行估计,评估行动者策略的优劣,并更新行动者策略网络的参数,完成一次学习;将验证集输入更新后的行动者策略网络中,计算选择得到的奖励;重复上述步骤,直至所述验证集的奖励不再提高,得到训练完成的子视频段预测网络。6.根据权利要求5所述的视频传输方法,其特征在于,用于计算奖励的奖励函数为:其中,系数γ、系数η、系数λ是用户偏好权重,k表示传输...

【专利技术属性】
技术研发人员:张雅婷于化龙李英明韩庆瑞
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1