音频处理方法技术

技术编号：39804965 阅读：18 留言：0更新日期：2023-12-22 02:38

本申请公开一种音频处理方法，包括：对第一音频执行第一语音增强处理，生成增强音频，其中所述第一音频中具有目标语音和背景噪音，所述背景噪音包括人声噪音；获取增强音频的能量信息；根据所述增强音频的能量信息，对所述增强音频叠加加性噪声，以获取加噪音频；对所述加噪音频执行第二语音增强处理，生成增强了所述目标语音的目标音频

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、电子设备及存储介质

[0001]本申请涉及音频处理
，具体而言，涉及一种音频处理
、
音频播放及语音识别方法
、
电子设备及存储介质
。

技术介绍

[0002]当前，提出了基于信号处理的语音增强
(Speech Enhancement)
方法
。
在基于信号处理的语音增强方法中，通常假设噪声是平稳的或慢变的，适用于仅存在平稳底噪的场景，但是难以适用于更加普遍的非平稳噪声场景
。
[0003]当前，还提出了基于模型的语音增强方法
。
基于模型的语音增强方法在低信噪比
、
非平稳的条件下相对信号处理算法更有优势，能处理大多数平稳和非平稳的普通噪声
。
[0004]然而，当音频信号中存在人声干扰时，例如他人在周围交谈时，由于人声干扰和目标语音同属于语音信号，常规的语音识别工具难以区分人声干扰和目标语音，造成目标语音残留人声干扰噪音，严重影响听觉体验
。
[0005]本
技术介绍
描述的内容仅为了便于了解本领域的相关技术，不视作对现有技术的承认
。

技术实现思路

[0006]根据本申请的示例实施例，提供了一种音频处理方法
、
电子设备及存储介质
。
[0007]在本申请的第一方面中，提供一种音频处理方法，所述方法包括：
[0008]对第一音频执行第一语音增强处理，生成增强音频，其中所述第一音频中具...

【技术保护点】

【技术特征摘要】
1.
一种音频处理方法，其特征在于，所述方法包括：对第一音频执行第一语音增强处理，生成增强音频，其中所述第一音频包括目标语音和背景噪音，所述背景噪音包括人声噪音；获取所述增强音频的能量信息；根据所述增强音频的能量信息，对所述增强音频叠加加性噪声以获取加噪音频；对所述加噪音频执行第二语音增强处理，生成目标音频
。2.
根据权利要求1所述的音频处理方法，其特征在于，所述获取增强音频的能量信息，包括：根据预定采样频率对所述增强音频进行采样，以获取所述预定采样频率对应的每个采样点的能量幅值；根据所述能量幅值以及所述采样点的个数，确定所述增强音频的音频平均能量，作为所述增强音频的能量信息
。3.
根据权利要求2所述的音频处理方法，其特征在于，根据所述增强音频的能量信息，对所述增强音频叠加加性噪声，包括：根据所述音频平均能量确定叠加噪声比例，其中所述叠加噪声比例与所述音频平均能量正相关；根据确定的所述叠加噪声比例，对所述增强音频叠加所述加性噪声
。4.
根据权利要求3所述的音频处理方法，其特征在于，所述根据所述音频平均能量确定叠加噪声比例，包括：判断所述音频平均能量是否大于预定阈值；若所述音频平均能量大于预定阈值，则在第一预定比例区间内确定所述叠加噪声比例；若所述音频平均能量不大于预定阈值，则在第二预定比例区间内确定所述叠加噪声比例；其中，第一预定比例区间值大于第二预定比例区间值
。5.
根据权利要求3所述的音频处理方法，其特征在于，所述根据所述音频平均能量确定叠加噪声比例，包括：预先建立多个能量区间与多个噪声比例的映射关系；在所述多个能量区间中，确定所述音频平均能量所属的目标能量区...

【专利技术属性】
技术研发人员：何礼，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人