一种视频码率自适应调整方法、装置及电子设备制造方法及图纸

技术编号:21552811 阅读:35 留言:0更新日期:2019-07-07 00:40
本发明专利技术实施例提供了一种视频码率自适应调整方法、装置及电子设备,其中,该方法包括:获取客户端发送的播放当前视频时的当前网络信息和当前播放信息,获取服务器的当前带宽负载,并将当前带宽负载、当前网络信息以及当前播放信息,输入与当前视频对应的预先建立的码率调整模型中,得到对客户端的码率进行调整的调整码率。这样,可以依据该服务器的当前带宽负载、当前网络信息以及当前播放信息,得到对客户端的码率进行调整的调整码率。从而可以综合考虑与该服务器通信连接的多个客户端对该服务器的带宽负载的影响和该客户端的当前网络信息以及当前播放信息,来调整该客户端正在播放的视频的码率。

A Video Rate Adaptive Adjustment Method, Device and Electronic Equipment

【技术实现步骤摘要】
一种视频码率自适应调整方法、装置及电子设备
本专利技术涉及视频处理
,特别是涉及一种视频码率自适应调整方法、装置及电子设备。
技术介绍
为了为用户提供高质量的视频服务,主流的媒体内容提供商在向用户提供视频时,通常是在视频播放过程中,由客户端根据客户端网络状态和/或客户端缓冲区长度,自适应的改变正在播放的视频的码率,然后从通信连接的服务器获取与改变后的码率对应的视频帧;例如,当客户端带宽较高或客户端视频缓冲区长度较长时,提高正在播放的视频的码率,当客户端带宽较小或客户端视频缓冲区长度较短时,则降低正在播放的视频的码率;又例如,当客户端视频缓冲区长度较长时,根据客户端带宽的大小来调节正在播放的视频的码率,当客户端视频缓冲区长度较短时,则根据该客户端视频缓冲区的长短来调节正在播放的视频的码率。然而,专利技术人在实现本专利技术的过程中发现,现有技术至少存在如下问题:当多个客户端同时从该服务器获取高码率的视频帧时,该服务器需要使用较大的带宽来传输该高码率的视频帧,当从该服务器获取高码率视频帧的客户端的视频的码率增加时,会进一步增加该服务器的带宽的负载。
技术实现思路
本专利技术实施例的目的在本文档来自技高网...

【技术保护点】
1.一种视频码率自适应调整方法,其特征在于,应用于服务器,所述方法包括:获取客户端发送的播放当前视频时的当前网络信息和当前播放信息,其中,所述网络信息包括:网络带宽,所述播放信息包括:当前缓冲区长度;获取所述服务器的当前带宽负载,并将所述当前带宽负载、所述当前网络信息以及所述当前播放信息,输入与所述当前视频对应的预先建立的码率调整模型中,得到对所述客户端的码率进行调整的调整码率。

【技术特征摘要】
1.一种视频码率自适应调整方法,其特征在于,应用于服务器,所述方法包括:获取客户端发送的播放当前视频时的当前网络信息和当前播放信息,其中,所述网络信息包括:网络带宽,所述播放信息包括:当前缓冲区长度;获取所述服务器的当前带宽负载,并将所述当前带宽负载、所述当前网络信息以及所述当前播放信息,输入与所述当前视频对应的预先建立的码率调整模型中,得到对所述客户端的码率进行调整的调整码率。2.根据权利要求1所述的方法,其特征在于,所述当前网络信息还包括:当前网络延迟以及当前网络地理信息,所述当前播放信息包括:当前客户端设备类型、当前播放视频、所述当前播放视频的码率、当前播放视频的卡顿信息。3.根据权利要求2所述的方法,其特征在于,在所述将所述当前带宽负载、所述当前网络信息以及所述当前播放信息,输入与所述当前视频对应的预先建立的码率调整模型中,得到对所述客户端的码率进行调整的调整码率之前,所述方法还包括:在预设码率偏好值表中,查询与所述当前带宽负载、所述当前网络信息以及所述当前播放信息,对应的码率偏好值;其中,在所述码率偏好值表中,不同的带宽负载、不同的网络信息以及不同的播放信息,对应不同的码率偏好值;所述将所述当前带宽负载、所述当前网络信息以及所述当前播放信息,输入与所述当前视频对应的预先建立的码率调整模型中,得到对所述客户端的码率进行调整的调整码率,包括:将所述码率偏好值、所述当前网络信息以及所述当前播放信息,输入与所述当前视频对应的预先训练得到的码率调整神经网络模型,得到对所述客户端的码率进行调整的调整码率。4.根据权利要求3所述的方法,其特征在于,所述预先训练得到的码率调整神经网络模型为采用Actor-Critic算法进行强化学习,训练得到的神经网络模型。5.根据权利要求4所述的方法,其特征在于,所述码率偏好值大于或等于0,且小于或等于1;预先训练与所述当前视频对应的所述码率调整神经网络模型,包括:获取预先设置的与所述当前视频对应的训练样本和测试样本,其中,所述训练样本包括:码率偏好值训练样本、网络信息训练样本、播放信息训练样本,训练样本的播放信息包括:训练样本视频的码率、训练样本视频的卡顿时长;所述测试样本包括:码率偏好值测试样本、网络信息测试样本、播放信息测试样本,测试样本的播放信息包括:测试样本视频的码率、测试样本视频的卡顿时长;采用所述训练样本对预先建立的码率调整神经网络模型进行n次强化学习和n+N次强化学习,得到第n次强化学习后的码率调整神经网络模型和第n+N次强化学习后的码率调整神经网络模型,其中,所述n大于或等于0,当n=0时,所述第n次强化学习采用的码率调整神经网络模型为所述预先建立的码率调整神经网络模型,所述N大于或等于1;将所述测试样本分别输入至所述第n次强化学习后的码率调整神经网络模型和所述第n+N次强化学习后的码率调整神经网络模型,得到所述第n次强化学习后的码率调整神经网络模型输出的第一测试输出码率和所述第n+N次强化学习后的码率调整神经网络模型输出的第二测试输出码率,其中,当所述n=0时,所述第n次强化学习后的码率调整神经网络模型输出的第一测试输出码率,为所述预先建立的码率调整神经网络模型输出的输出码率;获取所述当前视频的最大码率和最小码率,并根据所述最大码率、所述最小码率和所述码率偏好值,计算所述当前视频的目标码率;根据所述第一测试输出码率、所述第二测试输出码率、所述测试样本视频的卡顿时长、所述测试样本视频的码率和所述当前视频的目标码率,计算对预先建立的码率调整神经网络模型进行第n次强化学习的奖励rewardn和对预先建立的码率调整神经网络模型进行第n+N次强化学习的奖励rewardn+N;分别计算所述第n次强化学习的奖励rewardn的方差和均值,所述第n+N次强化学习的奖励rewardn+N的方差和均值;当所述第n次强化学习的奖励rewardn的方差与所述第n+N次强化学习的奖励rewardn+N的方差的差值,在预设方差阈值范围内,且所述第n次强化学习的奖励rewardn的均值与所述第n+N次强化学习的奖励rewardn+N的均值的差值,在预设的均值阈值范围内时,将所述第n+N次强化学习后的码率调整神经网络模型作为所述预先训练得到的码率调整神经网络模型;否则,采用所述训练样本对所述第n+N次强化学习后的码率调整神经网络模型进行第n+N+1次强化学习。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一测试输出码率、所述第二测试输出码率、所述测试样本视频的卡顿时长、所述测试样本视频的码率和所述当前视频的目标码率,计算对预先建立的码率调整神经网络模型进行第n次强化学习的奖励rewardn和对预先建立的码率调整神经网络模型进行第n+N次强化学习的奖励rewardn+N,包括:当所述第一测试输出码率小于所述目标码率时,采用如下公式:rewardn=bitraten-rebuffer_time-|last_bitrate-bitraten|计算对预先建立的码率调整神经网络模型进行第n次强化学习的奖励rewardn;当所述第一测试输出码率大于或等于所述目标码率时,采用如下公式:计算对所述预先建立的码率调整神经网络模型进行第n次强化学习的奖励rewardn;当所述第二测试输出码率小于所述目标码率时,采用如下公式:rewardn+N=bitraten+N-rebuffer_time-|last_bitrate-bitraten+N|计算对预先建立的码率调整神经网络模型进行第n+N次强化学习的奖励rewardn+N;当所述第二测试输出码率大于或等于所述目标码率时,采用如下公式:计算对所述预先建立的码率调整神经网络模型进行第n+N次强化学习的奖励rewardn+N;其中,所述n为大于1的自然数,所述bitraten为所述第一测试输出码率,所述bitraten+N为所述第二测试输出码率,所述rebuffer_time为所述测试样本视频的卡顿时长,所述last_bitrate为所述测试样本视频的码率,所述为所述目标码率。7.一种...

【专利技术属性】
技术研发人员:王亚楠王海利庹虎
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1