一种音频增益控制方法、装置、设备及存储介质制造方法及图纸

技术编号：41843684 阅读：25 留言：0更新日期：2024-06-27 18:23

本发明专利技术公开了一种音频增益控制方法、装置、设备及存储介质。该方法包括：获取目标音频信号，并将目标音频信号进行语音解析处理，获得目标音频信号中每帧音频帧对应的音频帧信息；根据音频帧信息，确定目标音频帧对应的目标短时能量和目标频谱质心；根据目标短时能量、目标频谱质心和预先确定的预设理论判断阈值，确定目标音频帧对应的实际音频帧类型；基于实际音频帧类型和预设曲线向量，确定目标音频帧对应的目标增益比值；根据目标音频帧对应的目标增益比值，将目标音频信号进行音频增益处理，以简化增益比值的计算步骤，降低确定语音端点的复杂度，进而提升音频增益控制精度，以使处理后的语音听感更加顺滑，提升使用体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频处理，尤其涉及一种音频增益控制方法、装置、设备及存储介质。

技术介绍

1、在语音信号处理流程中，agc(automatic gain control,自动增益控制功能),可以自动调节输出端的播放音量，使接收者听到的音量保持在一个稳定的水平，使输出的音频信号电平保持在一个舒适稳定范围内，即说话者的声音过大，agc会自动降低增益；反之，会自动提高增益。

2、在将语音信号进行agc处理时，往往还需要对降噪之后的语音信号进行vad(voiceactivity detection，语音端点检测技术)处理，以准确地定位出语音的开始和结束点，以提升增益处理后语音的平滑度。

3、目前，一般采用基于特征的检测方法进行语音端点检测处理。该方法主要是通过提取能够区分语音段和无语音段的特征参数，包含时域特征和频域特征两种，然后设置一定的阈值并依此来判断语音端点。现有的处理方法，大都是在频域分别对语音和噪声进行估计，再利用信噪比特征进行语音和非语音的区分，但是计算程度较为复杂度，其次现有的检测算法不能很好保留在持续说话时...

【技术保护点】

1.一种音频增益控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述音频帧信息，确定目标音频帧对应的目标短时能量和目标频谱质心，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述目标音频帧对应的帧短时能量，确定所述帧短时能量平滑后的目标短时能量，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所有所述第一历史帧对应的历史目标短时能量，确定所述目标音频帧对应的目标短时能量，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一历史帧数量、所述第二历史帧数量、所述第一目标帧数量和...

【技术特征摘要】

1.一种音频增益控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述音频帧信息，确定目标音频帧对应的目标短时能量和目标频谱质心，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述目标音频帧对应的帧短时能量，确定所述帧短时能量平滑后的目标短时能量，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所有所述第一历史帧对应的历史目标短时能量，确定所述目标音频帧对应的目标短时能量，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一历史帧数量、所述第二历史帧数量、所述第一目标帧数量和所述第二目标帧数量，确定所述目标音频帧对应的目标短时能量，包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述目标短时能量、所述目标频谱质心和预先确定的预设理论判断阈值，确定所述目标音频帧对应的实际音频帧类型，包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述目标短时能量、所述目标频谱质心、所述能量判断阈值和所述频谱判断阈值，确定所述目标音频帧对应的理论音频帧类型，包括：

8.根据权利要求6所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：江月希，李亮，方俊武，
申请(专利权)人：睿魔智能科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人