一种音频增益控制方法、装置、设备及存储介质制造方法及图纸

技术编号:41843684 阅读:25 留言:0更新日期:2024-06-27 18:23
本发明专利技术公开了一种音频增益控制方法、装置、设备及存储介质。该方法包括:获取目标音频信号,并将目标音频信号进行语音解析处理,获得目标音频信号中每帧音频帧对应的音频帧信息;根据音频帧信息,确定目标音频帧对应的目标短时能量和目标频谱质心;根据目标短时能量、目标频谱质心和预先确定的预设理论判断阈值,确定目标音频帧对应的实际音频帧类型;基于实际音频帧类型和预设曲线向量,确定目标音频帧对应的目标增益比值;根据目标音频帧对应的目标增益比值,将目标音频信号进行音频增益处理,以简化增益比值的计算步骤,降低确定语音端点的复杂度,进而提升音频增益控制精度,以使处理后的语音听感更加顺滑,提升使用体验。

【技术实现步骤摘要】

本专利技术涉及音频处理,尤其涉及一种音频增益控制方法、装置、设备及存储介质


技术介绍

1、在语音信号处理流程中,agc(automatic gain control,自动增益控制功能),可以自动调节输出端的播放音量,使接收者听到的音量保持在一个稳定的水平,使输出的音频信号电平保持在一个舒适稳定范围内,即说话者的声音过大,agc会自动降低增益;反之,会自动提高增益。

2、在将语音信号进行agc处理时,往往还需要对降噪之后的语音信号进行vad(voiceactivity detection,语音端点检测技术)处理,以准确地定位出语音的开始和结束点,以提升增益处理后语音的平滑度。

3、目前,一般采用基于特征的检测方法进行语音端点检测处理。该方法主要是通过提取能够区分语音段和无语音段的特征参数,包含时域特征和频域特征两种,然后设置一定的阈值并依此来判断语音端点。现有的处理方法,大都是在频域分别对语音和噪声进行估计,再利用信噪比特征进行语音和非语音的区分,但是计算程度较为复杂度,其次现有的检测算法不能很好保留在持续说话时字节之间的合理停顿,本文档来自技高网...

【技术保护点】

1.一种音频增益控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述音频帧信息,确定目标音频帧对应的目标短时能量和目标频谱质心,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述目标音频帧对应的帧短时能量,确定所述帧短时能量平滑后的目标短时能量,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所有所述第一历史帧对应的历史目标短时能量,确定所述目标音频帧对应的目标短时能量,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述第一历史帧数量、所述第二历史帧数量、所述第一目标帧数量和...

【技术特征摘要】

1.一种音频增益控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述音频帧信息,确定目标音频帧对应的目标短时能量和目标频谱质心,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述目标音频帧对应的帧短时能量,确定所述帧短时能量平滑后的目标短时能量,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所有所述第一历史帧对应的历史目标短时能量,确定所述目标音频帧对应的目标短时能量,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述第一历史帧数量、所述第二历史帧数量、所述第一目标帧数量和所述第二目标帧数量,确定所述目标音频帧对应的目标短时能量,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述目标短时能量、所述目标频谱质心和预先确定的预设理论判断阈值,确定所述目标音频帧对应的实际音频帧类型,包括:

7.根据权利要求6所述的方法,其特征在于,所述根据所述目标短时能量、所述目标频谱质心、所述能量判断阈值和所述频谱判断阈值,确定所述目标音频帧对应的理论音频帧类型,包括:

8.根据权利要求6所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:江月希李亮方俊武
申请(专利权)人:睿魔智能科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1