【技术实现步骤摘要】
音频处理方法、装置、存储介质、电子设备
[0001]本专利技术涉及音频处理领域,具体而言,涉及一种音频处理方法、装置、存储介质、电子设备。
技术介绍
[0002]随着音视频通信系统的普及,不可避免地会碰到各式各样复杂的声学环境,同时也对音频算法有了更高的要求,即保证音视频通信系统在不同的声学环境下都能保持高效能。在实时语音通信中,区分前景声音还是背景声音对于音频3A算法中的自动增益控制(Automatic Gain Control,AGC)模块是至关重要的,而在一些情况下,例如在前景声音很小或没有前景声音的情况下,语音活动检测(Voice activity detection,VAD)算法无法区分前景声音与背景声音,进而AGC会误将背景声音音量提高,导致远端用户听到更大的背景声音,极大影响用户体验,尤其是在开放式会议室,经常会出现背景人声场景。
[0003]目前很多方案都是基于训练模型来区分前景声音与背景声音,但是此类方案不仅计算量大、无法实时工作,而且分辨准确率并没有质的提高。
[0004]针对上述的问题, ...
【技术保护点】
【技术特征摘要】
1.一种音频处理方法,其特征在于,包括:获取音频采集端采集到的待处理音频;对所述待处理音频进行滤波处理,得到处理结果,其中,所述滤波处理用于从所述待处理音频中滤除部分音频信号分量,所述部分音频信号分量的频率低于预设阈值;从所述处理结果中提取第一预设时长内的多个语音帧;获取所述多个语音帧的能量变化量;基于所述能量变化量确定所述待处理音频的类别。2.根据权利要求1所述的音频处理方法,其特征在于,对所述待处理音频进行滤波处理,得到所述处理结果包括:采用有限长单位冲激响应滤波器对所述待处理音频进行高通滤波处理,得到所述处理结果,其中,所述有限长单位冲激响应滤波器的滤波器阶数为大于或等于1的正整数。3.根据权利要求1所述的音频处理方法,其特征在于,从所述处理结果中提取所述第一预设时长内的所述多个语音帧包括:获取第二预设时长,其中,所述第二预设时长为所述多个语音帧中每个语音帧对应的单位时长;基于所述第一预设时长和所述第二预设时长,采用语音活动检测方式从所述处理结果中提取所述多个语音帧。4.根据权利要求1所述的音频处理方法,其特征在于,获取所述多个语音帧的所述能量变化量包括:获取所述多个语音帧中每个语音帧对应的能量值,得到多个能量值;计算所述多个能量值的能量平均值和能量方差值。5.根据权利要求4所述的音频处理方法,其特征在于,基于所述能量变化量确定所述待处理音频的类别包括:基于所述能量平均值与第一阈值的比较结果以及所述能量方差值与第二阈值的比较结果,确定所述待处理音频的类别。6.根据权利要求5所述的音频处理方法,其特征在于,基于所述能量平均值与所述第一阈值的比较结果以及所述能量方差值与所述第二阈值的比较结果,确定所述待处理音频的类别包括:当所述能量平均值小于所述第一阈值且所述能量方差值小于所述第二阈值时,确定所述待处理音频为背景声音。7.根据权利要求5所述的音频处理方法,其特征在于,基于所述能量平均值与所述第一阈值的比较结果以及所述能量方差值与所述第二阈值的比较结果,确定所述待处理音频的类别包括:当所述能量平均值大于或等于所述第一阈值且所述能量方差值大于或等于所述第二阈值时,确定...
【专利技术属性】
技术研发人员:熊飞飞,冯津伟,
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。