一种教学声场环境的去噪方法技术

技术编号:38142089 阅读:9 留言:0更新日期:2023-07-08 09:57
本申请适用于语音处理技术领域,提供了一种教学声场环境的去噪方法,该方法包括:获取待处理音频,其中,待处理音频为教学声场环境中的音频;提取待处理音频中的第一音频特征向量;将第一音频特征向量输入至预先训练的噪音去除目标模型,得到预测音频;对预测音频进行音频去噪判定,将判定结果为音频去噪成功对应的预测音频作为目标音频。可见,本申请实施例可以有效去除教学声场环境中的噪音。可以有效去除教学声场环境中的噪音。可以有效去除教学声场环境中的噪音。

【技术实现步骤摘要】
一种教学声场环境的去噪方法


[0001]本申请属于语音处理
,尤其涉及一种教学声场环境的去噪方法。

技术介绍

[0002]教学声场环境的声源主要是教师的讲解声、课件的解说、音乐和效果声。教学信息的传递主要是通过教师的讲授语音或影片、课件中的解说传递给学生。因此,教学声场环境的声音效果主要追求语言的清晰度,兼顾声音的丰满度。现有技术中,教学声场环境中往往会存在各种类型的噪音,降低信噪比、掩盖有用信息、破坏声场的正常分布,使声场存在染色,导致信息声音质感的严重削弱,为此,缺乏一种能够有效去除教学声场环境噪音的方法。

技术实现思路

[0003]本申请实施例提供了一种教学声场环境的去噪方法、装置、服务器以及计算机可读存储介质,可以解决现有技术中缺乏一种能够有效去除教学声场环境噪音的方法的技术问题。
[0004]第一方面,本申请实施例提供了一种教学声场环境的去噪方法,包括:
[0005]获取待处理音频;
[0006]提取所述待处理音频中的第一音频特征向量;
[0007]将所述第一音频特征向量输入至预先训练的噪音去除目标模型,得到预测音频;
[0008]对所述预测音频进行音频去噪判定,将判定结果为音频去噪成功对应的预测音频作为目标音频。
[0009]在第一方面的可选的实现方式中,将所述第一音频特征向量输入至预先训练的噪音去除目标模型,得到预测音频之前,还包括:
[0010]构建预先训练的噪音去除目标模型。
[0011]在第一方面的可选的实现方式中,构建预先训练的噪音去除目标模型,包括:
[0012]获取训练音频;
[0013]根据所述训练音频和所述训练音频对应的真实音频,对噪音去除目标模型进行训练,得到训练后的噪音去除目标模型。
[0014]在第一方面的可选的实现方式中,噪音去除目标模型包括特征提取网络、特征编码网络、音频生成网络以及特征转换网络;
[0015]根据所述训练音频和所述训练音频对应的真实音频,对噪音去除目标模型进行训练,得到训练后的噪音去除目标模型,包括:
[0016]将所述训练音频输入至所述特征提取网络,得到第二音频特征向量;
[0017]所述训练音频对应的随机音频输入至所述特征编码网络,得到第三音频特征向量;
[0018]将所述第二音频特征向量和所述第三音频特征向量输入至所述音频生成网络,得
到音频生成向量;
[0019]将所述音频生成向量输入至特征转换网络,得到预测训练音频;
[0020]对所述预测训练音频和所述真实音频进行音频相似度评价,根据相似度评价结果对所述音频生成网络进行迭代更新;
[0021]根据特征提取网络、特征编码网络、迭代更新后的音频生成网络以及特征转换网络,形成训练后的噪音去除目标模型。
[0022]在第一方面的可选的实现方式中,对所述预测音频进行音频去噪判定,将判定结果为音频去噪成功对应的预测音频作为目标音频,包括:
[0023]生成所述预测音频对应的第一文本;
[0024]生成所述待处理音频对应的第二文本
[0025]将所述第一文本对应的第一文本向量和所述第二文本的第二向量代入至下列公式,得到文本相似度:
[0026]其中,H表示文本相似度,A表示第一文本向量,B表示第二文本向量;
[0027]当所述文本相似度大于相似度阈值时,判定结果为音频去噪成功,将判定结果为音频去噪成功对应的预测音频作为目标音频。
[0028]第二方面,本申请实施例提供了一种教学声场环境的去噪装置,包括:
[0029]获取模块,用于获取待处理音频;
[0030]提取模块,用于提取所述待处理音频中的第一音频特征向量;
[0031]预测模块,用于将所述第一音频特征向量输入至预先训练的噪音去除目标模型,得到预测音频;
[0032]判定模块,用于对所述预测音频进行音频去噪判定,将判定结果为音频去噪成功对应的预测音频作为目标音频。
[0033]在第二方面的一种可选得实现方式中,所述装置,还包括:
[0034]构建模块。
[0035]在第二方面的一种可选得实现方式中,所述构建模块,包括:
[0036]获取子模块,用于获取训练音频;
[0037]训练子模块,用于根据所述训练音频和所述训练音频对应的真实音频,对噪音去除目标模型进行训练,得到训练后的噪音去除目标模型。
[0038]在第二方面的一种可选得实现方式中,噪音去除目标模型包括特征提取网络、特征编码网络、音频生成网络以及特征转换网络;
[0039]所述训练子模块,包括:
[0040]第一特征提取单元,用于将所述训练音频输入至所述特征提取网络,得到第二音频特征向量;
[0041]第二特征提取单元,所述训练音频对应的随机音频输入至所述特征编码网络,得到第三音频特征向量;
[0042]音频生成单元,用于将所述第二音频特征向量和所述第三音频特征向量输入至所述音频生成网络,得到音频生成向量;
[0043]特征转换单元,用于将所述音频生成向量输入至特征转换网络,得到预测训练音频;
[0044]音频相似度评价单元,用于对所述预测训练音频和所述真实音频进行音频相似度评价,根据相似度评价结果对所述音频生成网络进行迭代更新;
[0045]形成单元,用于根据特征提取网络、特征编码网络、迭代更新后的音频生成网络以及特征转换网络,形成训练后的噪音去除目标模型。
[0046]在第二方面的一种可选得实现方式中,所述判定模块,包括:
[0047]第一生成子模块,用于生成所述预测音频对应的第一文本;
[0048]第二生成子模块,用于生成所述待处理音频对应的第二文本
[0049]文本相似度子模块,用于将所述第一文本对应的第一文本向量和所述第二文本的第二向量代入至下列公式,得到文本相似度:
[0050]其中,H表示文本相似度,A表示第一文本向量,B表示第二文本向量;
[0051]判定子模块,用于当所述文本相似度大于相似度阈值时,判定结果为音频去噪成功,将判定结果为音频去噪成功对应的预测音频作为目标音频。
[0052]第三方面,本申请实施例提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的方法。
[0053]第三方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。
[0054]本申请实施例与现有技术相比存在的有益效果是:
[0055]通过获取待处理音频,其中,待处理音频为教学声场环境中的音频,提取待处理音频中的第一音频特征向量,将第一音频特征向量输入至预先训练的噪音去除目标模型,得到预测音频,对预测音频进行音频去噪判定,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种教学声场环境的去噪方法,其特征在于,包括:获取待处理音频,其中,所述待处理音频为教学声场环境中的音频;提取所述待处理音频中的第一音频特征向量;将所述第一音频特征向量输入至预先训练的噪音去除目标模型,得到预测音频;对所述预测音频进行音频去噪判定,将判定结果为音频去噪成功对应的预测音频作为目标音频。2.如权利要求1所述的教学声场环境的去噪方法,其特征在于,将所述第一音频特征向量输入至预先训练的噪音去除目标模型,得到预测音频之前,还包括:构建预先训练的噪音去除目标模型。3.如权利要求2所述的教学声场环境的去噪方法,其特征在于,构建预先训练的噪音去除目标模型,包括:获取训练音频;根据所述训练音频和所述训练音频对应的真实音频,对噪音去除目标模型进行训练,得到训练后的噪音去除目标模型。4.如权利要求3所述的教学声场环境的去噪方法,其特征在于,噪音去除目标模型包括特征提取网络、特征编码网络、音频生成网络以及特征转换网络;根据所述训练音频和所述训练音频对应的真实音频,对噪音去除目标模型进行训练,得到训练后的噪音去除目标模型,包括:将所述训练音频输入至所述特征提取网络,得到第二音频特征向量;所述训练音频对应的随机音频输入至所述特征编码网络,得到第三音频特征向量;将所述第二音频特征向量和所述第三音频特征向量输入至所述音频生成网络,得到音频生成向量;将所述音频生成向量输入至特征转换网络,得到预测训练音频;对所述预测训练音频和所述真实音频进行音频相似度评价,根据相似度评价结果对所述音频生成网络进行迭代更新;根据特征提取网络、特征编码网络、迭代更新后的音频生成网络以及特征转换网络,形成训练后的噪音去除目标模型。5.如权利要求1所...

【专利技术属性】
技术研发人员:吴晓涛张旺宝谭国燊李志华
申请(专利权)人:珠海谷田科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1