音频数据压缩方法及相关产品技术

技术编号:37857046 阅读:19 留言:0更新日期:2023-06-15 20:47
本申请属于音视频技术领域,具体涉及一种音频数据压缩方法、音频数据压缩装置、计算机可读介质、电子设备以及计算机程序产品。该方法包括:获取用于对音频数据进行数据压缩的目标压缩量,所述目标压缩量是所述音频数据在压缩前后的数据量差值;对所述音频数据进行分类处理,得到至少两种音频子数据;根据所述目标压缩量分别为所述至少两种音频子数据分配目标压缩比,所述目标压缩比是所述音频子数据的压缩量与压缩前数据量的比值;按照所述目标压缩比对所述音频子数据进行压缩处理。该方法可以控制不同类别的音频子数据进行差异化地数据压缩,提高音频数据的压缩播放效果。提高音频数据的压缩播放效果。提高音频数据的压缩播放效果。

【技术实现步骤摘要】
音频数据压缩方法及相关产品


[0001]本申请属于音视频
,具体涉及一种音频数据压缩方法、音频数据压缩装置、计算机可读介质、电子设备以及计算机程序产品。

技术介绍

[0002]在音视频通话、直播等业务应用中,声音信号从发送方终端采集、压缩编码后经由网络传输或分发到接收方终端,最终在接收方终端上进行解码和播放。正常情况下发送方能确保以平稳而均匀地方式发送语音编码数据包,但由于传输网络存在不可预测的网络抖动现象,所以数据包到达接收方终端的时间也是不稳定的,即有时隔了很长时间没有收到一个数据包,而有时则短时间内收到非常多的数据包,导致直接播放这些数据包会出现声音时有时无的问题。当接收方在一个较短时间内收到大量数据包时,容易导致播放通道堵塞甚至缓冲区溢出,进而产生播放延时、播放滞后,声音断续等问题。

技术实现思路

[0003]本申请的目的在于提供一种音频数据压缩方法、音频数据压缩装置、计算机可读介质、电子设备以及计算机程序产品,至少在一定程度上克服相关技术中存在的音频播放稳定性差的技术问题。
[0004]本申请的其他特性和本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频数据压缩方法,其特征在于,包括:获取用于对音频数据进行数据压缩的目标压缩量,所述目标压缩量是所述音频数据在压缩前后的数据量差值;对所述音频数据进行分类处理,得到至少两种音频子数据;根据所述目标压缩量分别为所述至少两种音频子数据分配目标压缩比,所述目标压缩比是所述音频子数据的压缩量与压缩前数据量的比值;按照所述目标压缩比对所述音频子数据进行压缩处理。2.根据权利要求1所述的音频数据压缩方法,其特征在于,获取用于对音频数据进行数据压缩的目标压缩量,包括:监测在音频缓冲区中存储的音频数据的实时存储帧数;获取所述音频缓冲区的期望存储帧数;当所述实时存储帧数大于所述期望存储帧数时,根据所述实时存储帧数与所述期望存储帧数的差值确定用于对音频数据进行数据压缩的目标压缩量。3.根据权利要求1所述的音频数据压缩方法,其特征在于,对所述音频数据进行分类处理,包括:对所述音频数据中的各个数据帧进行语音活跃检测,以确定所述数据帧为语音帧或者非语音帧;将所述音频数据中的连续分布的语音帧标记为携带语音内容的语音子数据;将所述音频数据中的连续分布的非语音帧标记为未携带语音内容的非语音子数据。4.根据权利要求3所述的音频数据压缩方法,其特征在于,对所述音频数据进行分类处理,还包括:对所述携带语音内容的语音子数据进行语速估计,得到用于表示所述语音子数据的语速快慢的语速状态参数;根据所述语速状态参数将所述语音子数据标记为具有不同语速级别的语音片段。5.根据权利要求4所述的音频数据压缩方法,其特征在于,对所述携带语音内容的语音子数据进行语速估计,包括:对所述携带音频内容的语音子数据进行基音检测,得到所述语音子数据中各个数据帧的基音周期;根据所述基音周期的时域变化状态对所述语音子数据进行语速估计,所述时域变化状态用于表示所述基音周期在时间域上的周期变化趋势。6.根据权利要求5所述的音频数据压缩方法,其特征在于,根据所述基音周期的时域变化状态对所述语音子数据进行语速估计,包括:在时间域上比较两个相邻数据帧的基音周期,得到后一数据帧相对于前一数据帧的基音周期的周期变化趋势和周期变化幅度,所述周期变化趋势用于表示基音周期的上升、下降或者持平趋势,所述周期变化幅度用于表示后一数据帧与前一数据帧的基音周期差值;根据所述周期变化趋势和周期变化幅度确定所述基音周期在两个相邻数据帧之间的时域变化状态,所述时域变化状态包括周期上升状态、周期减小状态或者周期持平状态中的至少两种;在时间域上统计所述时域变化状态出现状态切换的状态切换频次,所述状态切换频次
用于表示所述时域变化状态由一种状态切换至另一种状态的切换次数;根据所述状态切换频次对所述语音子数据进行语速估计,所述语音子数据的语速与所述状态切换频次呈正相关关系。7.根据权利要求6所述的音频数据压缩方法,其特征在于,根据所述周期变化趋势和周期变化幅度确定所述基音周期在两个相邻数据帧之间的时域变化状态,包括:获取与所述周期变化趋势相关联的幅度阈值,所述幅度阈值包括与周期上升趋势相关的第一阈值以及与周期下降趋势相关的第二阈值,所述第一阈值为正数,所述第二阈值为负数;若所述周期变化幅度小于所述第一阈值且大于所述第二阈值,则将所述基音周期在两个相邻数据帧之间的时域变化状态标记为周期持平状态;若所述周期变化幅度大于所述第一阈值,则将所述时域变化状态标记为周期上升状态;若所述周期变化幅度小于所述第二阈值,则将所述时域变化状态标记为周期下降状态。8.根据权利要求6所述的音频数据压缩方法,其特征在于,根据所述状态切换频次对所述语音子数据进行语速估计,包括:获取所述语音子数据中的数据帧的帧数;根据所述状态切换频次与所述帧数的比值确定用于表示所述语音子数据的语速快慢的语速状态参数。9.根据权利要求5所述的音频数据压缩方法,其特征在于,根据所述基音周期的时域变化状态对所述语音子...

【专利技术属性】
技术研发人员:梁俊斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1