音频处理方法、装置、介质及电子设备制造方法及图纸

技术编号:46443526 阅读:4 留言:0更新日期:2025-09-19 20:44
本申请属于人工智能技术领域,具体涉及一种音频处理方法、音频处理装置、计算机可读介质、电子设备以及计算机程序产品。该音频处理方法包括:对音频信号进行特征提取,得到多个音频帧的频域特征;音频信号中携带有语音信号和噪声信号;对所述音频帧的频域特征进行序列化建模,得到帧内序列特征,所述帧内序列特征用于表示在单个所述音频帧内的多个频点之间的频率序列关系;对多个所述音频帧的帧内序列特征进行序列化建模,得到帧间序列特征,所述帧间序列特征用于表示在多个所述音频帧之间的时间序列关系;根据所述帧间序列特征对所述音频信号进行信号调制,得到去除噪声信号后的语音信号。本申请实施例可以提高语音增强降噪效果。

【技术实现步骤摘要】

本申请属于人工智能,具体涉及一种音频处理方法、音频处理装置、计算机可读介质、电子设备以及计算机程序产品。


技术介绍

1、随着硬件计算能力的迅速提升,尤其是图形处理器(graphics processing unit,gpu)优越的并行计算能力,使得深度学习技术得到了井喷式的发展。目前,基于深度学习的语音增强降噪方法被广泛应用于视频会议、通话、智能语音助手、语音识别等场景,为人们的生产生活带来了巨大的助力。

2、然而,由于真实应用场景噪声环境的复杂性,基于深度学习的语音增强降噪方法通常都会存在明显的噪声残留或者语音损伤问题,因而具有一定的应用局限性。


技术实现思路

1、本申请提供一种音频处理方法、音频处理装置、计算机可读介质、电子设备以及计算机程序产品,目的在于提高语音增强降噪效果。

2、根据本申请实施例的一个方面,提供一种音频处理方法,该方法包括:

3、对音频信号进行特征提取,得到多个音频帧的频域特征;所述音频信号中携带有语音信号和噪声信号;

>4、对所述音频帧的本文档来自技高网...

【技术保护点】

1.一种音频处理方法,其特征在于,包括:

2.根据权利要求1所述的音频处理方法,其特征在于,根据所述帧间序列特征对所述音频信号进行信号调制,得到去除噪声信号后的语音信号,包括:

3.根据权利要求2所述的音频处理方法,其特征在于,根据所述掩码信息对所述音频信号进行信号调制,得到去除噪声信号后的语音信号,包括:

4.根据权利要求2所述的音频处理方法,其特征在于,对所述帧间序列特征进行解码还原,得到用于去除噪声信号的掩码信息,包括:

5.根据权利要求4所述的音频处理方法,其特征在于,所述解码器包括依次连接的转置卷积层、批标准化层和激活层,所述编码...

【技术特征摘要】

1.一种音频处理方法,其特征在于,包括:

2.根据权利要求1所述的音频处理方法,其特征在于,根据所述帧间序列特征对所述音频信号进行信号调制,得到去除噪声信号后的语音信号,包括:

3.根据权利要求2所述的音频处理方法,其特征在于,根据所述掩码信息对所述音频信号进行信号调制,得到去除噪声信号后的语音信号,包括:

4.根据权利要求2所述的音频处理方法,其特征在于,对所述帧间序列特征进行解码还原,得到用于去除噪声信号的掩码信息,包括:

5.根据权利要求4所述的音频处理方法,其特征在于,所述解码器包括依次连接的转置卷积层、批标准化层和激活层,所述编码器包括依次连接的卷积层、批标准化层和激活层;所述转置卷积层用于对输入数据进行转置卷积处理得到维度升高的数据,所述卷积层用于对输入数据进行卷积处理得到维度降低的数据,所述批标准化层用于对输入数据进行归一化处理,所述激活层用于向输入数据引入非线性特征。

6.根据权利要求5所述的音频处理方法,其特征在于,所述卷积层在频域空间上的卷积步长大于一,所述卷积层在时域空间上的卷积步长等于一,所述转置卷积层与所述卷积层具有相同的卷积步长。

7.根据...

【专利技术属性】
技术研发人员:邹欢彬
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1