音频降噪方法、装置及计算机可读存储介质制造方法及图纸

技术编号:31501617 阅读:19 留言:0更新日期:2021-12-22 23:19
本申请实施例提供了一种音频降噪方法、装置及计算机可读存储介质,涉及语音处理技术领域。该方法包括:从音频流中获取当前时刻的当前音频数据和预设的场景标签;对当前音频数据进行语音识别,确定当前音频数据的第一人声类别;基于第一人声类别和场景标签,生成针对当前音频数据的目标降噪参数;基于目标降噪参数对音频流进行降噪处理。本申请实施例通过对当前音频数据进行语音识别,并结合场景标签来匹配相应的目标降噪参数,达到了提升音质的技术效果。效果。效果。

【技术实现步骤摘要】
音频降噪方法、装置及计算机可读存储介质


[0001]本申请涉及语音处理
,具体而言,本申请涉及一种音频降噪方法、装置及计算机可读存储介质。

技术介绍

[0002]在网络数字时代,声音被录制下来以后,无论是说话声、歌声、乐器,乃至噪音都可以通过数字音乐软件处理,而人们为了追求优良的音质往往需要对音频文件做进一步的降噪处理,减少外界噪音对听众的干扰。
[0003]现有技术中,一般通过服务器端配置固定的降噪参数。例如,在网络直播场景下,为了改善主播的声音质量,录制过程中会加入降噪功能来消除主播语音采集过程中带入的背景杂音。但是固定的降噪参数无法匹配不同的音频文件,使得降噪效果不理想。

技术实现思路

[0004]本申请提供了一种音频降噪方法、装置及计算机可读存储介质,用于解决降噪效果不理想的技术问题。
[0005]第一方面,提供了一种音频降噪方法,该方法包括:
[0006]从音频流中获取当前时刻的当前音频数据和预设的场景标签;
[0007]对当前音频数据进行语音识别,确定当前音频数据的第一人声类别;
[0008]基于第一人声类别和场景标签,生成针对当前音频数据的目标降噪参数;
[0009]基于目标降噪参数对音频流进行降噪处理。
[0010]在一个可能的实现方式中,基于第一人声类别和场景标签,生成针对当前音频数据的目标降噪参数,包括:
[0011]获取前一时刻的音频数据对应的第二人声类别;
[0012]若第一人声类别与第二人声类别不匹配,则基于第一人声类别和场景标签,生成针对当前音频数据的目标降噪参数。
[0013]在一个可能的实现方式中,对当前音频数据进行语音识别,确定当前音频数据的第一人声类别,包括:
[0014]对当前音频数据进行语音检测,提取至少一个人声片段;
[0015]获取每一人声片段的音频特征;
[0016]基于音频特征确定当前音频数据的第一人声类别;其中,所述第一人声类别包括讲话声和歌声。
[0017]在另一个可能的实现方式中,基于第一人声类别和场景标签,生成针对当前音频数据的目标降噪参数,包括:
[0018]对第一人声类别对应的人声降噪参数、场景标签对应的场景降噪参数进行加权处理,得到目标降噪参数;其中,当第一人声类别为讲话声时所对应的人声降噪参数大于当第一人声类别为歌声时所对应的人声降噪参数。
[0019]在另一个可能的实现方式中,基于第一人声类别和场景标签,生成针对当前音频数据的目标降噪参数,包括:
[0020]确定音频数据的采集通路;
[0021]基于第一人声类别、场景标签和采集通路,生成针对当前音频数据的目标降噪参数。
[0022]在又一个可能的实现方式中,基于第一人声类别、场景标签和采集通路,生成针对当前音频数据的目标降噪参数,包括:
[0023]若采集通路不存在相匹配的降噪属性,则基于第一人声类别、场景标签和采集通路,生成针对当前音频数据的目标降噪参数。
[0024]在又一个可能的实现方式中,基于第一人声类别、场景标签和采集通路,生成针对当前音频数据的目标降噪参数,包括:
[0025]对第一人声类别对应的人声降噪参数、场景标签对应的场景降噪参数和采集通路对应的通路降噪参数进行加权处理,得到目标降噪参数。
[0026]在又一个可能的实现方式中,对第一人声类别对应的人声降噪参数、场景标签对应的场景降噪参数和采集通路对应的通路降噪参数进行加权处理,得到目标降噪参数,包括:
[0027]确定人声降噪参数的第一权重,场景降噪参数的第二权重,通路降噪参数的第三权重;
[0028]基于第一权重、第二权重和第三权重,对人声降噪参数、场景降噪参数和通路降噪参数加权求和,得到目标降噪参数;其中第一权重大于第二权重和第三权重中的任一项。
[0029]第二方面,提供了一种音频降噪装置,该装置包括:
[0030]获取模块,用于从音频流中获取当前时刻的当前音频数据和预设的场景标签;
[0031]识别模块,用于对当前音频数据进行语音识别,确定当前音频数据的第一人声类别;
[0032]生成模块,用于基于第一人声类别和场景标签,生成针对当前音频数据的目标降噪参数;
[0033]降噪模块,用于基于目标降噪参数对音频流进行降噪处理。
[0034]在一个可能的实现方式中,上述生成模块,具体用于:
[0035]获取前一时刻的音频数据对应的第二人声类别;
[0036]若第一人声类别与第二人声类别不匹配,则基于第一人声类别和场景标签,生成针对当前音频数据的目标降噪参数。
[0037]在一个可能的实现方式中,上述识别模块,具体用于:
[0038]对当前音频数据进行语音检测,提取至少一个人声片段;
[0039]获取每一人声片段的音频特征;
[0040]基于音频特征确定当前音频数据的第一人声类别,其中第一人声类别包括讲话声和歌声。
[0041]在另一个可能的实现方式中,上述生成模块,具体用于:
[0042]对第一人声类别对应的人声降噪参数、场景标签对应的场景降噪参数进行加权处理,得到目标降噪参数;其中,当第一人声类别为讲话声时所对应的人声降噪参数大于当第
一人声类别为歌声时所对应的人声降噪参数。
[0043]在另一个可能的实现方式中,上述生成模块,具体包括:
[0044]确定单元,用于确定音频数据的采集通路;
[0045]生成单元,用于基于第一人声类别、场景标签和采集通路,生成针对当前音频数据的目标降噪参数。
[0046]在又一个可能的实现方式中,上述生成单元,具体用于:
[0047]若采集通路不存在相匹配的降噪属性,则基于第一人声类别、场景标签和采集通路,生成针对当前音频数据的目标降噪参数。
[0048]在又一个可能的实现方式中,上述生成单元,还用于:
[0049]对第一人声类别对应的人声降噪参数、场景标签对应的场景降噪参数和采集通路对应的通路降噪参数进行加权处理,得到目标降噪参数。
[0050]在又一个可能的实现方式中,上述生成单元,还用于:
[0051]确定人声降噪参数的第一权重,场景降噪参数的第二权重,通路降噪参数的第三权重;
[0052]基于第一权重、第二权重和第三权重,对人声降噪参数、场景降噪参数和通路降噪参数加权求和,得到目标降噪参数;其中第一权重大于第二权重和第三权重中的任一项。
[0053]第三方面,提供了一种电子设备,该电子设备包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现本申请第一方面所示的音频降噪方法。
[0054]第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本申请第一方面所示的音频降噪方法。
[0055]第五方面,本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频降噪方法,其特征在于,包括:从音频流中获取当前时刻的当前音频数据和预设的场景标签;对所述当前音频数据进行语音识别,确定所述当前音频数据的第一人声类别;基于所述第一人声类别和所述场景标签,生成针对所述当前音频数据的目标降噪参数;基于所述目标降噪参数对所述音频流进行降噪处理。2.根据权利要求1所述的音频降噪方法,其特征在于,所述基于所述第一人声类别和所述场景标签,生成针对所述当前音频数据的目标降噪参数,包括:获取前一时刻的音频数据对应的第二人声类别;若所述第一人声类别与所述第二人声类别不匹配,则基于所述第一人声类别和所述场景标签,生成针对所述当前音频数据的目标降噪参数。3.根据权利要求1所述的音频降噪方法,其特征在于,所述对所述当前音频数据进行语音识别,确定所述当前音频数据的第一人声类别,包括:对所述当前音频数据进行语音检测,提取至少一个人声片段;获取每一所述人声片段的音频特征;基于所述音频特征确定所述当前音频数据的第一人声类别;其中,所述第一人声类别包括讲话声和歌声。4.根据权利要求1所述的音频降噪方法,其特征在于,所述基于所述第一人声类别和所述场景标签,生成针对所述当前音频数据的目标降噪参数,包括:对所述第一人声类别对应的人声降噪参数、所述场景标签对应的场景降噪参数进行加权处理,得到所述目标降噪参数;其中,当所述第一人声类别为讲话声时所对应的人声降噪参数大于当所述第一人声类别为歌声时所对应的人声降噪参数。5.根据权利要求1所述的音频降噪方法,其特征在于,所述基于所述第一人声类别和所述场景标签,生成针对所述当前音频数据的目标降噪参数,包括:确定所述音频数据的采集通路;基于所述第一人声类别、所述场景标签和所述采集通路,生成针对所述当前音频数据的目标降噪参数。6.根据权利要求5所述的音频降噪方法,其特征...

【专利技术属性】
技术研发人员:郑吉剑
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1