【技术实现步骤摘要】
一种音频降噪方法、设备、系统及存储介质
[0001]本申请涉及数据处理
,尤其涉及一种音频降噪方法、设备、系统及存储介质。
技术介绍
[0002]语音降噪技术是指在对语音信号中的噪声进行消除,以还原出干净语音的技术。
[0003]目前,通常采用机器学习模型进行语音降噪,机器学习模型需要基于学习到的降噪知识,对语音信号中的每一帧进行降噪,这经常导致在某些语音帧上出行降噪过度的问题,造成语音失真,语音降噪效果并不理想。
技术实现思路
[0004]本申请的多个方面提供一种音频降噪方法、设备及存储介质,用以提高音频降噪质量。
[0005]本申请实施例提供一种音频降噪方法,包括:
[0006]对音频中的目标音频帧进行噪声检测;
[0007]若确定所述目标音频帧中包含符合预设要求的噪声,则获取所述目标音频帧对应的降噪参数;
[0008]按照所述降噪参数,对所述目标音频帧进行降噪,以获得降噪后音频帧;
[0009]基于所述降噪后音频帧,输出降噪后的所述音频。
[ ...
【技术保护点】
【技术特征摘要】
1.一种音频降噪方法,其特征在于,包括:对音频中的目标音频帧进行噪声检测;若确定所述目标音频帧中包含符合预设要求的噪声,则获取所述目标音频帧对应的降噪参数;按照所述降噪参数,对所述目标音频帧进行降噪,以获得降噪后音频帧;基于所述降噪后音频帧,输出降噪后的所述音频。2.根据权利要求1所述的方法,其特征在于,还包括:若确定所述目标音频帧中未包含符合所述预设要求的噪声,则输出所述目标音频帧。3.根据权利要求1所述的方法,其特征在于,所述对目标音频帧进行噪声检测,包括:将所述目标音频帧拆分为至少一个帧片段;分别对所述至少一个帧片段进行噪声检测;若包含噪声的帧片段满足第一预设条件,则确定所述目标音频帧包含符合预设要求的噪声。4.根据权利要求3所述的方法,其特征在于,所述第一预设条件包括:包含噪声的帧片段的数量大于第一数量阈值。5.根据权利要求3所述的方法,其特征在于,所述若包含噪声的帧片段满足第一预设条件,则确定所述目标音频帧包含符合预设要求的噪声,包括:若包含噪声的帧片段满足第一预设条件,则将噪声标识字段配置为T,作为所述噪声标识字段在所述目标音频帧下的取值,其中,T为预估的噪声持续时间;若所述噪声标识字段在所述目标音频帧下的取值大于第一阈值,则确定所述目标音频帧包含符合预设要求的噪声。6.根据权利要求5所述的方法,其特征在于,还包括:若所述目标音频帧中包含符合预设要求的噪声的帧片段不满足所述第一预设条件,则将噪声标识字段的原始值减1,作为所述噪声标识字段在所述目标音频帧下的取值,其中,所述原始值为噪声标识字段在所述目标音频帧的上一音频帧下的取值;若所述噪声标识字段在所述目标音频帧下的取值小于或等于第二阈值,则确定所述目标音频帧未包含符合预设要求的噪声,所述第二阈值小于或等于所述第一阈值。7.根据权利要求3所述的方法,其特征在于,所述分别对所述至少一个帧片段进行噪声检测,包括:在目标帧片段中确定符合能量要求的观测帧点;计算目标帧片段中观测帧点的数量;若所述观测帧点的数量满足第二预设条件,则确定所述目标帧片段为包含噪声的帧片段;其中,所述目标帧片段为所述目标音频帧包含的至少一个帧片段中的任意一个。8.根据权利要求7所述的方法,其特征在于,所述第二预设条件包括:所述观测帧点的数量大于第二数量阈值。9.根据权利要求7所述的方法,其特征在于,所述在目标帧片段中确定符合能量要求的观测帧点,包括:确定目标帧片段对应的频域数据;
基于所述频域数据,分别计算所述目标帧片段包含的各帧点上的能量值;从各帧点中选择能量值满足第三预设条件的帧点,作为观测帧点。10.根据权利要求9所述的方法,其特征在于,所述第三预设条件包括:当前帧点的能量值大于其在前的两个帧点的能量值,且所述当前帧点与其在前的两个帧点之间的能量差均大于预设能量差阈值。11.根据权利要求1所述的方法,其特征在于,所述获取所述目标音频帧对应的降噪参数,包括:提取所述目标音频帧的音频特征;将提取到的音频特征输入降噪模型;在所述降噪模型中,基于音频特征与降噪参数的映射关系,确定所述目标音频帧对应的降噪参数。12.根据权利要求1或11所述的方法,...
【专利技术属性】
技术研发人员:杜秉聰,熊飞飞,谭国庆,冯津伟,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。