音频处理方法及相关装置制造方法及图纸

技术编号:9695449 阅读:89 留言:0更新日期:2014-02-21 02:28
本发明专利技术实施例公开了音频处理方法及相关装置。其中,一种音频处理方法可包括:将接收到的音频数据包缓冲到缓冲区;累计出当前已经接收且已经从缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长;若缓冲区当前缓冲的未播放音频数据包的数量少于第一阈值,或缓冲区当前缓冲的未播放音频数据包的总采样时长小于或等于第二阈值,则当缓冲区缓冲的接收到的未播放音频数据包的总采样时长大于或等于当前网络抖动估算值之后,从缓冲区读取出未播放音频数据包进行播放,当前网络抖动估算值基于累计出的总播放时长和累计出的总采样时长得到。本发明专利技术实施例提供的技术方案有利于尽量消除网络抖动对音频播放流畅性和播放声音延迟的影响。

【技术实现步骤摘要】
音频处理方法及相关装置
本专利技术涉及网络
,具体主要涉及一种音频处理方法及相关装置。
技术介绍
音频网络抖动可指网络传输音频数据包时的延迟变化程度。由于网络可能发生拥塞等,排队延迟将影响端到端延迟,并导致通过同一连接传输的音频数据包延迟各不相同,且音频数据包可能出现乱序,进而可能造成音频播放卡顿或杂音等不良用户体验。其中,由于音频源(即音频生产方)发送的音频数据包经过网络传输可能产生网络抖动,进而可能造成音频播放终端(即音频消费方)出现卡顿和延迟等不良用户体验。因此,现有技术通过缓冲固定较长时长(例如3秒)的音频数据包来消除网络抖动对音频播放的影响,能够在很大程度上保证音频播放的流畅性。本专利技术的专利技术人在研究和实践过程中发现,现有技术至少存在以下的技术问题:现有技术通过缓冲固定较长时长的音频数据包来消除网络抖动对音频播放流畅性的影响,但由于缓冲的音频数据包时长通常较长,可能造成音频接收方用户听到声音的延迟可能较大。
技术实现思路
本专利技术实施例提供音频处理方法及相关装置,以期尽量消除网络抖动对音频播放流畅性和播放声音延迟的影响。本专利技术实施例一方面提供一种音频处理方法,可包括:将接收到的音频数据包缓冲到缓冲区;累计出当前已经接收且已经从所述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长;若所述缓冲区当前缓冲的未播放音频数据包的数量少于第一阈值,或所述缓冲区当前缓冲的未播放音频数据包的总采样时长小于或等于第二阈值,则当所述缓冲区缓冲的接收到的未播放音频数据包的总采样时长大于或等于当前网络抖动估算值之后,从所述缓冲区读取出未播放音频数据包进行播放,所述当前网络抖动估算值基于所述累计出的所述总播放时长和所述累计出的所述总采样时长得到。本专利技术实施例另一方面提供一种终端设备,包括:接收缓冲单元,用于将接收到的音频数据包缓冲到缓冲区;累计单元,用于累计出当前已经接收且已经从所述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长;缓冲播放单元,若所述缓冲区当前缓冲的未播放音频数据包的数量少于第一阈值,或所述缓冲区当前缓冲的未播放音频数据包的总采样时长小于或者等于第二阈值,则当所述缓冲区缓冲的接收到的未播放音频数据包的总采样时长大于或者等于当前网络抖动估算值之后,从所述缓冲区读取出未播放的音频数据包进行播放,其中,所述当前网络抖动估算值基于所述累计出的所述总播放时长和所述累计出的所述总采样时长得到。可以看出,本专利技术实施例的技术方案中,累计出当前已经接收且已经从缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长;若上述缓冲区当前缓冲的未播放音频数据包的数量少于第一阈值,或上述缓冲区当前缓冲的未播放音频数据包的总采样时长小于或者等于第二阈值,当缓冲区缓冲的接收到的未播放音频数据包的总采样时长大于或等于当前网络抖动估算值之后,从缓冲区读取出未播放音频数据包进行播放,其中,当前网络抖动估算值基于上述累计出的上述总播放时长和上述累计出的上述总采样时长得到。由于累计出了当前已经接收且已经从缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长,而当前网络抖动估算值基于当前累计出的上述总播放时长和当前累计出的上述总采样时长得到,在进行音频缓冲时缓冲的采样时长大于或等于当前网络抖动估算值,由于网络抖动估算值充分考虑到了网络延时累积效应,并且网络抖动估算值会随着当前累计出的总播放时长和当前累计出的总采样时长动态变化,通过实践发现,这样机制相对于按照固定时长进行缓冲的现有机制,有利于尽量消除累计网络抖动对音频播放流畅性和播放声音延迟的影响,获得很好的播放体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种音频处理方法的流程示意图;图2是本专利技术实施例提供的另一种音频处理方法的流程示意图;图3是本专利技术实施例提供的另一种音频处理方法的流程示意图;图4是本专利技术实施例提供的一种计算当前网络抖动估算值的方法的流程示意图;图5是本专利技术实施例提供的一种终端设备的示意图;图6是本专利技术实施例提供的另一种终端设备的示意图;图7是本专利技术实施例提供的另一种终端设备的示意图。具体实施方式本专利技术实施例提供音频处理方法及相关装置,以期尽量消除网络抖动对音频播放流畅性和播放声音延迟的影响。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。以下分别进行详细说明。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本专利技术一种音频处理方法的一个实施例,其中,一种音频处理方法,可以包括:将接收到的音频数据包缓冲到缓冲区;累计出当前已经接收且已经从上述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长;若上述缓冲区当前缓冲的未播放音频数据包的数量少于第一阈值,或上述缓冲区当前缓冲的未播放音频数据包的总采样时长小于或者等于第二阈值,则当上述缓冲区缓冲的接收到的未播放音频数据包的总采样时长大于或等于当前网络抖动估算值之后,从上述缓冲区读取出未播放音频数据包进行播放,上述当前网络抖动估算值基于上述累计出的上述总播放时长和上述累计出的上述总采样时长得到。首先请参见图1,图1是本专利技术一个实施例提供的一种音频处理方法的流程示意图。如图1所示,本专利技术一个实施例提供的一种音频处理方法可包括以下内容:101、将接收到的音频数据包缓冲到缓冲区。在本专利技术一些可能的实施例方式中,上述将接收到的音频数据包缓冲到缓冲区可以包括:将接收到的归属于某音频文件(为便于引述,可称之为第一音频文件,其中,第一音频文件可为直播音频文件或非直播音频文件)的音频数据包缓冲到缓冲区。102、累计出当前已经接收且已经从上述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长。其中,音频数据包的采样时长即是音频数据包的理论播放时长。在本专利技术一些可能的实施例方式中,累计出当前已经接收且已经从上述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长可包括:累计出从预设时刻开始到当前时刻为止,已经接收且已经从上述缓冲区中读取出进行播放的音频数据包的总采样时长和总播放时长。在本专利技术的另一些可能的实施例方式本文档来自技高网
...
音频处理方法及相关装置

【技术保护点】
一种音频处理方法,其特征在于,包括:将接收到的音频数据包缓冲到缓冲区;累计出当前已经接收且已经从所述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长;若所述缓冲区当前缓冲的未播放音频数据包的数量少于第一阈值,或所述缓冲区当前缓冲的未播放音频数据包的总采样时长小于或等于第二阈值,则当所述缓冲区缓冲的接收到的未播放音频数据包的总采样时长大于或等于当前网络抖动估算值之后,从所述缓冲区读取出未播放音频数据包进行播放,所述当前网络抖动估算值基于所述累计出的所述总播放时长和所述累计出的所述总采样时长得到。

【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:将接收到的音频数据包缓冲到缓冲区;累计出当前已经接收且已经从所述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长,所述音频数据包的采样时长即是音频数据包的理论播放时长;若所述缓冲区当前缓冲的未播放音频数据包的数量少于第一阈值,或所述缓冲区当前缓冲的未播放音频数据包的总采样时长小于或等于第二阈值,则当所述缓冲区缓冲的接收到的未播放音频数据包的总采样时长大于或等于当前网络抖动估算值之后,从所述缓冲区读取出未播放音频数据包进行播放,所述当前网络抖动估算值基于所述累计出的所述总播放时长和所述累计出的所述总采样时长得到;若所述缓冲区当前缓冲的未播放音频数据包的数量大于或等于第一阈值,或所述缓冲区当前缓冲的未播放音频数据包的总采样时长大于第二阈值,从上述缓冲区读取出未播放音频数据包进行播放。2.根据权利要求1所述的音频处理方法,其特征在于,所述累计出当前已经接收且已经从所述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长,包括:累计出从预设时刻开始到当前时刻为止,已经接收且已经从所述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长。3.根据权利要求1所述的方法,其特征在于,所述将接收到的音频数据包缓冲到缓冲区,包括:将接收到的归属于第一音频文件的音频数据包缓冲到缓冲区;其中,所述累计出当前已经接收且已经从所述缓冲区中读取出来进行播放的音频数据包的总采样时长和总播放时长,包括:累计出当前已经接收且已经从所述缓冲区中读取出来进行播放的,归属于所述第一音频文件的所有音频数据包的总采样时长和总播放时长。4.根据权利要求1至3任一项所述的方法,其特征在于,所述当前网络抖动估算值等于所述累计出的总播放时长减所述累计出的所述总采样时长得到的差值。5.根据权利要求1至3任一项所述的方法,其特征在于,所述当前网络抖动估算值等于所述累计出的所述总播放时长减所述累计出的所述总采样时长得到的差值乘以抖动风险系数β。6.根据权利要求5所述的方法,其特征在于,所述抖动风险系数β的取值范围为0...

【专利技术属性】
技术研发人员:曹木勇李俊明龙兴平李广发
申请(专利权)人:腾讯科技成都有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1