一种音频去抖动系统和方法技术方案

技术编号:13163077 阅读:72 留言:0更新日期:2016-05-10 09:33
本发明专利技术实施例提供音频去抖动系统和方法,涉及音频数据处理领域。能够在音频数据的传输过程中,持续捕捉音频数据的抖动时间的相关参数,自动学习不同的网络抖动规律和环境,根据捕捉到的多方面的相关参数选择更为优化的方案对抖动缓冲区的大小进行调整,取得了更好的音频去抖动效果。

【技术实现步骤摘要】

本专利技术设及音频数据处理领域,具体而言,设及。
技术介绍
在VoIP通信中,极易受到网络延迟/抖动因素的影响。网络延迟会导致语音延迟; 为解决抖动,一般增加抖动缓冲区,实现对乱序包的重排序,并实现抖动平滑。通常采用的 抖动缓冲技术,即在接收方设定一个缓冲区,当话音包到达时首先进入缓冲池暂存,随后系 统再W稳定平滑的速率将话音包从缓冲池中取出,经解压后播放给受话者。运种缓冲技术 可W在一定限度内有效消除话音抖动并提高音质。常见的去抖动缓冲方法是动态的改变抖 动缓冲区大小,现在使用的去抖动缓冲方法,缓冲区调整方法较简单、抖动时间粒度大,导 致声音失真,去抖动效果不理想。因此,如何对动态调整抖动缓冲区的方法进行优化是目前 面临的一大课题。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供。 本专利技术实施例提供的音频去抖动系统,应用于音频处理装置,所述音频去抖动系 统包括: 音频数据接收模块,用于接收音频数据; 平均抖动时间获取模块,用于按照预设的时间周期获取所述音频数据在每一个所 述时间周期内的平均抖动时间; 平均抖动时间比较模块,用于将当前时间周期内的平均抖动时间与前一个时间周 期内的平均抖动时间进行比较; 抖动缓冲区调整模块,用于在当前时间周期内的平均抖动时间大于前一个时间周 期内的平均抖动时间时,按照预设的抖动缓冲区增长速度,对抖动缓冲区的大小进行增加; W及在当前时间周期内的平均抖动时间小于前一个时间周期内的平均抖动时间时,按照预 设的抖动缓冲区减小速度,对抖动缓冲区的大小进行减小; 抖动缓冲区调整控制模块,用于用于当所述抖动缓冲区的大小达到预设的最大尺 寸时,停止增加抖动缓冲区的大小;W及当抖动缓冲区的大小达到预设的最小尺寸时,停止 减小抖动缓冲区的大小; 所述音频数据接收模块还用于将接收的音频数据写入所述抖动缓冲区; 音频数据读取模块,用于按照预设的速度从所述抖动缓冲区中读取音频数据并输 出。 本专利技术实施例提供的音频去抖动方法,应用于音频去抖动系统,所述音频去抖动 方法包括: 音频数据接收步骤,接收音频数据; 获取平均抖动时间步骤,按照预设的时间周期获取所述音频数据在每一个所述时 间周期内的平均抖动时间; 比较平均抖动时间步骤,将当前时间周期内的平均抖动时间与前一个时间周期内 的平均抖动时间进行比较; 调整抖动缓冲区模步骤,在当前时间周期内的平均抖动时间大于前一个时间周期 内的平均抖动时间时,按照预设的抖动缓冲区增长速度,对抖动缓冲区的大小进行增加;在 当前时间周期内的平均抖动时间小于前一个时间周期内的平均抖动时间时,按照预设的抖 动缓冲区减小速度,对抖动缓冲区的大小进行减小; 抖动缓冲区调整控制步骤,用于当所述抖动缓冲区的大小达到预设的最大尺寸 时,停止增加抖动缓冲区的大小;W及当抖动缓冲区的大小达到预设的最小尺寸时,停止减 小抖动缓冲区的大小; 写入音频数据步骤,将接收的音频数据写入所述抖动缓冲区; 读取音频数据步骤,按照预设的速度从所述抖动缓冲区中读取音频数据并输出。 与现有技术相比,本专利技术的音频去抖动系统和方法,能够在音频数据的传输过程 中,持续捕捉音频数据的抖动时间的相关参数,自动学习不同的网络抖动规律和环境,根据 捕捉到的多方面的相关参数选择更为优化的方案对抖动缓冲区的大小进行调整,取得了更 好的音频去抖动效果。 为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合 所附附图,作详细说明如下。【附图说明】 为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附 图作简单地介绍,应当理解,W下附图仅示出了本专利技术的某些实施例,因此不应被看作是对 范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W根据运 些附图获得其他相关的附图。 图1为本专利技术实施例提供的包括音频去抖动系统的音频处理装置的方框示意图。 图2为本专利技术较佳实施例提供的音频去抖动系统的功能模块示意图。 图3本专利技术较佳实施例提供的一种音频去抖动方法的流程图。 图4本专利技术较佳实施例提供的另一种音频去抖动方法的流程图。 图5本专利技术较佳实施例提供的又一种音频去抖动方法的流程图。 主要元件符号说明 【具体实施方式】 下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整 地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在 此处附图中描述和示出的本专利技术实施例的组件可WW各种不同的配置来布置和设计。因 此,W下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的 范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做 出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一 个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的 描述中,术语"第一"、"第二"等仅用于区分描述,而不能理解为指示或暗示相对重要性。 如图1所示,是本专利技术实施例提供的包括音频去抖动系统的音频处理装置100的方 框示意图。所述音频处理装置100可W是计算机如个人电脑(personal computer,PC)、平板 电脑等,也可W是移动设备如智能手机、个人数字助理(personal digital assistant, PDA)等。在本实施例中,所述音频处理装置100包括音频去抖动系统10、存储器20 W及处理 器30。 所述存储器20W及处理器30之间直接或间接地电性连接,W实现数据的传输或交 互。例如,运些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述音频 去抖动系统10包括至少一个可W软件或固件(firmware)的形式存储于所述存储器中或固 化在所述音频处理装置100的操作系统(operating system,OS)中的软件功能模块。所述处 理器用于执行存储器中存储的可执行模块,例如所述音频去抖动系统10包括的软件功能模 块或计算机程序。 其中,存储器20可W是,但不限于,随机存取存储器(Random Access Memory, RAM),只读存储器(Read Only Memoir ,ROM),可编程只读存储器(Programmable Read-Only Memoir, PROM),可擦除只读存储器化 rasable Programmable Read-Only Memoir ,EPROM), 电可擦除只读存储器巧Iectric Erasable Programmable Read-Only Memoir,EEPROM)等。 其中,存储器20用于存储程序,所述处理器30在接收到执行指令后,执行所述程序,下述本 专利技术实施例任一实施例掲示的流过程定义的音频处理装置100所执行的方法可W应用于处 理器30中,或者由处理器30实现。 处理器30可能是一种集成电路忍片,具有信号的处理能力。上述的处理器可W是 通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还本文档来自技高网...

【技术保护点】
一种音频去抖动系统,应用于音频处理装置,其特征在于,所述音频去抖动系统包括:音频数据接收模块,用于接收音频数据;平均抖动时间获取模块,用于按照预设的时间周期获取所述音频数据在每一个所述时间周期内的平均抖动时间;平均抖动时间比较模块,用于将当前时间周期内的平均抖动时间与前一个时间周期内的平均抖动时间进行比较;抖动缓冲区调整模块,用于在当前时间周期内的平均抖动时间大于前一个时间周期内的平均抖动时间时,按照预设的抖动缓冲区增长速度,对抖动缓冲区的大小进行增加;以及在当前时间周期内的平均抖动时间小于前一个时间周期内的平均抖动时间时,按照预设的抖动缓冲区减小速度,对抖动缓冲区的大小进行减小;抖动缓冲区调整控制模块,用于当所述抖动缓冲区的大小达到预设的最大尺寸时,停止增加抖动缓冲区的大小;以及当抖动缓冲区的大小达到预设的最小尺寸时,停止减小抖动缓冲区的大小;所述音频数据接收模块还用于将接收的音频数据写入所述抖动缓冲区;音频数据读取模块,用于按照预设的速度从所述抖动缓冲区中读取音频数据并输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:贺晓敏吴忠
申请(专利权)人:全时云商务服务股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1