一种多媒体文件的码率控制方法、装置、介质和设备制造方法及图纸

技术编号:28633325 阅读:13 留言:0更新日期:2021-05-28 16:30
本发明专利技术涉及一种多媒体文件的码率控制方法、装置、介质和设备。根据本发明专利技术实施例提供的方案,可以在接收到客户端发送的多媒体文件获取请求时,确定客户端所属组别,利用客户端所属组别对应的多臂老虎机模型,确定客户端对应的档位,进而将该档位对应版本的多媒体文件发送至该客户端,从而实现码率控制。可以通过奖励函数的设计,基于多媒体文件的播放状态,对每个分组的用户需求反馈做出及时地响应,实现每个MAB模型基于用户需求反馈的自适应调节,进而可以动态、及时地调整输出策略,精细准确地针对每个分组分别进行码率控制,保证码率控制的准确性,更好地满足用户需求,提升用户体验质量。

【技术实现步骤摘要】
一种多媒体文件的码率控制方法、装置、介质和设备
本专利技术涉及音视频传输
,特别涉及一种多媒体文件的码率控制方法、装置、介质和设备。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。短视频即短片视频,是一种互联网内容传播方式,一般是指在互联网新媒体上传播的时长在设定时长,例如5分钟以内的视频。随着近年来网络传输技术和音视频技术的不断发展,短视频播放平台成长得越来越成熟。在将短视频下发到客户端时,为了平衡视频播放的清晰度和卡顿率,满足用户的观看需求,需要选择合适的码率,而如何选择合适的码率,即如何有效地进行码率控制就显得非常重要。码率为下发一个音视频文件到客户端时,在单位时间内使用的数据流量,下发一个短视频选择的码率与短视频的清晰度有关。可以理解为,在进行短视频下发之前,针对不同码率,预先生成了清晰度不同的多个版本。清晰度不同的多个版本可以按照清晰度进行排序,每个版本对应一个档位。在进行短视频下发时,需要从多个档位中选择一个档位对应的短视频版本进行传输,以实现码率控制。现有的码率控制方法一般使用预测模型,通过对用户体验质量进行建模,确定出能带来最优用户体验的档位的短视频版本。但是对用户体验质量进行建模得到的预测模型,缺乏自适应性,无法对用户的需求反馈做出及时的反应,且预测模型无法满足不同用户的需求,码率控制的准确性无法得到有效保证。
技术实现思路
本专利技术实施例提供一种多媒体文件的码率控制方法、装置、介质和设备,用于解决现有的码率控制方法准确性较差的问题。第一方面,本专利技术提供了一种多媒体文件的码率控制方法,所述方法包括:响应客户端的多媒体文件获取请求,确定所述客户端所属组别,所述客户端所属组别是基于获取的所述客户端的本地资源特征信息确定的;利用所述客户端所属组别对应的多臂老虎机模型,确定所述客户端对应的档位,每个档位具有对应的多媒体文件的传输码率;所述多臂老虎机模型的奖励函数值是根据每次获取的属于所述组别的客户端反馈的播放状态参数确定并进行动态更新的;其中,所述播放状态参数是属于所述组别的客户端根据历史多媒体文件播放的播放状态进行动态反馈的;按照所述客户端对应的档位,获取对应版本的多媒体文件,并向所述客户端发送。第二方面,本专利技术还提供了一种多媒体文件的码率控制装置,所述装置包括:响应模块,用于响应客户端的多媒体文件获取请求,确定所述客户端所属组别,所述客户端所属组别是基于获取的所述客户端的本地资源特征信息确定的;确定模块,用于利用所述客户端所属组别对应的多臂老虎机模型,确定所述客户端对应的档位,每个档位具有对应的多媒体文件的传输码率;所述多臂老虎机模型的奖励函数值是根据每次获取的属于所述组别的客户端反馈的播放状态参数确定并进行动态更新的;其中,所述播放状态参数是属于所述组别的客户端根据历史多媒体文件播放的播放状态进行动态反馈的;发送模块,用于按照所述客户端对应的档位,获取对应版本的多媒体文件,并向所述客户端发送。第三方面,本专利技术还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现如上所述的方法。第四方面,本专利技术还提供了一种多媒体文件的码率控制设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存储的程序时,实现如上所述的方法步骤。根据本专利技术实施例提供的方案,可以在接收到客户端发送的多媒体文件获取请求时,确定客户端所属组别,利用客户端所属组别对应的多臂老虎机模型,确定客户端对应的档位,进而将该档位对应版本的多媒体文件发送至该客户端,从而实现码率控制。其中,用于更新多臂老虎机模型的奖励函数值,根据每次获得的对应组别的客户端反馈的播放状态参数确定,而播放状态参数是对应组别的客户端根据历史多媒体文件播放的播放状态进行动态反馈的。因此,可以通过奖励函数的设计,基于多媒体文件的播放状态,对每个分组的用户需求反馈做出及时地响应,实现每个MAB模型基于用户需求反馈的自适应调节,进而可以动态、及时地调整输出策略,精细准确地针对每个分组分别进行码率控制,保证码率控制的准确性,更好地满足用户需求,提升用户体验质量。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的多媒体文件的码率控制方法的流程示意图;图2为本专利技术实施例提供的确定客户端分组的流程示意图;图3为本专利技术实施例提供的多媒体文件的码率控制方法的流程示意图;图4为本专利技术实施例提供的多媒体文件的码率控制装置的结构示意图;图5为本专利技术实施例提供的多媒体文件的码率控制设备的结构示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面对本专利技术涉及的几个概念进行简单说明。多媒体文件:将影像、声音、图像、文字、文本、动画等至少两种媒体结合在一起,形成的具有一定功能的整体文件,例如短视频等等。短视频:即短片视频,是一种互联网内容传播方式,一般是指在互联网新媒体上传播的时长在设本文档来自技高网...

【技术保护点】
1.一种多媒体文件的码率控制方法,其特征在于,所述方法包括:/n响应客户端的多媒体文件获取请求,确定所述客户端所属组别,所述客户端所属组别是基于获取的所述客户端的本地资源特征信息确定的;/n利用所述客户端所属组别对应的多臂老虎机模型,确定所述客户端对应的档位,每个档位具有对应的多媒体文件的传输码率;所述多臂老虎机模型的奖励函数值是根据每次获取的属于所述组别的客户端反馈的播放状态参数确定并进行动态更新的;其中,所述播放状态参数是属于所述组别的客户端根据历史多媒体文件播放的播放状态进行动态反馈的;/n按照所述客户端对应的档位,获取对应版本的多媒体文件,并向所述客户端发送。/n

【技术特征摘要】
1.一种多媒体文件的码率控制方法,其特征在于,所述方法包括:
响应客户端的多媒体文件获取请求,确定所述客户端所属组别,所述客户端所属组别是基于获取的所述客户端的本地资源特征信息确定的;
利用所述客户端所属组别对应的多臂老虎机模型,确定所述客户端对应的档位,每个档位具有对应的多媒体文件的传输码率;所述多臂老虎机模型的奖励函数值是根据每次获取的属于所述组别的客户端反馈的播放状态参数确定并进行动态更新的;其中,所述播放状态参数是属于所述组别的客户端根据历史多媒体文件播放的播放状态进行动态反馈的;
按照所述客户端对应的档位,获取对应版本的多媒体文件,并向所述客户端发送。


2.如权利要求1所述的方法,其特征在于,确定所述客户端所属组别,包括:
获得所述客户端当前对应的本地资源特征信息;
根据获得的本地资源特征信息,确定所述客户端当前所属组别。


3.如权利要求2所述的方法,其特征在于,所述本地资源特征信息包括接入的网络类型信息、所在终端设备硬件属性信息以及网络环境特征信息中的至少一种。


4.如权利要求1所述的方法,其特征在于,利用所述客户端所属组别对应的多臂老虎机模型,确定所述客户端对应的档位,包括:
利用所述客户端所属组别对应的多臂老虎机模型,确定所述客户端对应的档位调节策略;
根据确定出的所述档位调节策略,对确定出的档位进行调节,将调节后的档位确定为所述客户端对应的档位。


5.如权利要求4所述的方法,其特征在于,所述方法还包括:
获取所述客户端最后一次播放多媒体文件时的播放状态参数;
并在指定的更新时刻,利用获取的播放状态参数确定出的奖励函数值,更新对应的多臂老虎机模型,该多臂老虎机模型为用于确定所述客户端最后一次播放的多媒体文件对应的档位调节策略的多臂老虎机模型。


6.如权利要求5所述的方法,其特征在于,每个多臂老虎机模型表示如下:
I=argmaxi(Xt(i)/Nt(i)+ct(i));
其中,确定出的档位调节策略I,为预先设定的档位调节策略i中,使得Xt(i)/Nt(i)+ct(i)最大的i;
Xt(i)代表档位调节策略i价值的估计值;
Nt(i)代表档位调节策略i作为确定出的档位调节策略I的次数;
t代表利用该多臂老虎机模型进行档位调节的总次数;
ct(i)代表档位调节策略i的置信区间上界,表示如下:






其中,Vt(i)表示在置信区间上界约束下的档位调节策略i历史奖励函数值的方差,表示档位调节策略i历史奖励函数值的方差,表示置信区间上界。


7.如权利要求6所述的方法,其特征在于,每个多臂...

【专利技术属性】
技术研发人员:胡文阳王汉超傅正佳
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:巴西;BR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1