音频降噪方法、装置及计算机可读存储介质制造方法及图纸

技术编号：31501617 阅读：19 留言：0更新日期：2021-12-22 23:19

本申请实施例提供了一种音频降噪方法、装置及计算机可读存储介质，涉及语音处理技术领域。该方法包括：从音频流中获取当前时刻的当前音频数据和预设的场景标签；对当前音频数据进行语音识别，确定当前音频数据的第一人声类别；基于第一人声类别和场景标签，生成针对当前音频数据的目标降噪参数；基于目标降噪参数对音频流进行降噪处理。本申请实施例通过对当前音频数据进行语音识别，并结合场景标签来匹配相应的目标降噪参数，达到了提升音质的技术效果。效果。效果。

全部详细技术资料下载

【技术实现步骤摘要】
音频降噪方法、装置及计算机可读存储介质

[0001]本申请涉及语音处理
，具体而言，本申请涉及一种音频降噪方法、装置及计算机可读存储介质。

技术介绍

[0002]在网络数字时代，声音被录制下来以后，无论是说话声、歌声、乐器，乃至噪音都可以通过数字音乐软件处理，而人们为了追求优良的音质往往需要对音频文件做进一步的降噪处理，减少外界噪音对听众的干扰。
[0003]现有技术中，一般通过服务器端配置固定的降噪参数。例如，在网络直播场景下，为了改善主播的声音质量，录制过程中会加入降噪功能来消除主播语音采集过程中带入的背景杂音。但是固定的降噪参数无法匹配不同的音频文件，使得降噪效果不理想。

技术实现思路

[0004]本申请提供了一种音频降噪方法、装置及计算机可读存储介质，用于解决降噪效果不理想的技术问题。
[0005]第一方面，提供了一种音频降噪方法，该方法包括：
[0006]从音频流中获取当前时刻的当前音频数据和预设的场景标签；
[0007]对当前音频数据进行语音识别，确定当前音频数据的第一人声类别；
[0008]基于第一人声类别和场景标签，生成针对当前音频数据的目标降噪参数；
[0009]基于目标降噪参数对音频流进行降噪处理。
[0010]在一个可能的实现方式中，基于第一人声类别和场景标签，生成针对当前音频数据的目标降噪参数，包括：
[0011]获取前一时刻的音频数据对应的第二人声类别；
[0012]若第一人声类别与第二人声类别不匹...

【技术保护点】

【技术特征摘要】
1.一种音频降噪方法，其特征在于，包括：从音频流中获取当前时刻的当前音频数据和预设的场景标签；对所述当前音频数据进行语音识别，确定所述当前音频数据的第一人声类别；基于所述第一人声类别和所述场景标签，生成针对所述当前音频数据的目标降噪参数；基于所述目标降噪参数对所述音频流进行降噪处理。2.根据权利要求1所述的音频降噪方法，其特征在于，所述基于所述第一人声类别和所述场景标签，生成针对所述当前音频数据的目标降噪参数，包括：获取前一时刻的音频数据对应的第二人声类别；若所述第一人声类别与所述第二人声类别不匹配，则基于所述第一人声类别和所述场景标签，生成针对所述当前音频数据的目标降噪参数。3.根据权利要求1所述的音频降噪方法，其特征在于，所述对所述当前音频数据进行语音识别，确定所述当前音频数据的第一人声类别，包括：对所述当前音频数据进行语音检测，提取至少一个人声片段；获取每一所述人声片段的音频特征；基于所述音频特征确定所述当前音频数据的第一人声类别；其中，所述第一人声类别包括讲话声和歌声。4.根据权利要求1所述的音频降噪方法，其特征在于，所述基于所述第一人声类别和所述场景标签，生成针对所述当前音频数据的目标降噪参数，包括：对所述第一人声类别对应的人声降噪参数、所述场景标签对应的场景降噪参数进行加权处理，得到所述目标降噪参数；其中，当所述第一人声类别为讲话声时所对应的人声降噪参数大于当所述第一人声类别为歌声时所对应的人声降噪参数。5.根据权利要求1所述的音频降噪方法，其特征在于，所述基于所述第一人声类别和所述场景标签，生成针对所述当前音频数据的目标降噪参数，包括：确定所述音频数据的采集通路；基于所述第一人声类别、所述场景标签和所述采集通路，生成针对所述当前音频数据的目标降噪参数。6.根据权利要求5所述的音频降噪方法，其特征...

【专利技术属性】
技术研发人员：郑吉剑，
申请(专利权)人：腾讯科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人