语音增强方法、语音增强装置及电子设备制造方法及图纸

技术编号:39007869 阅读:8 留言:0更新日期:2023-10-07 10:39
本申请涉及语音处理技术领域,提供一种语音增强方法、语音增强装置及电子设备。所述方法包括:获取包含噪声的语音样本;将所述语音样本输入到训练后的语音增强模型,获得所述语音增强模型输出的抑制准则;基于所述抑制准则对所述语音样本进行增强处理,获得增强后的语音信号。本申请实施例提供的方法可以提高语音增强的质量。增强的质量。增强的质量。

【技术实现步骤摘要】
语音增强方法、语音增强装置及电子设备


[0001]本申请涉及语音处理
,具体涉及一种语音增强方法、语音增强装置及电子设备。

技术介绍

[0002]随着人工智能技术的快速发展,语音信号处理在沉浸式体验系统、车载语音系统等领域发挥的作用越来越重要。语音增强技术是语音信号处理的前端预处理技术,其目标在于将干净语音信号从噪声中剥离出来。
[0003]传统的语音增强技术需要对语音和噪声信号做出统计假设,其目的是为了推导出每个频带的抑制准则。但是,对于真实环境中的语音和噪声数据来说,这些统计假设往往是不精确的(比如:对短时幅度谱或缓慢变化的噪声方差作出的高斯假设)。因此这种方法会受到噪声抑制不充分的影响,容易在增强信号中引入“音乐噪声”。

技术实现思路

[0004]本申请实施例提供一种语音增强方法、语音增强装置及电子设备,能够提高语音增强的质量。
[0005]第一方面,本申请实施例提供一种语音增强方法,包括:
[0006]获取包含噪声的语音样本;
[0007]将所述语音样本输入到训练后的语音增强模型,获得所述语音增强模型输出的抑制准则;
[0008]基于所述抑制准则对所述语音样本进行增强处理,获得增强后的语音信号。
[0009]在一个实施例中,所述方法还包括:
[0010]获取干净语音样本以及噪声样本;
[0011]基于所述干净语音样本以及所述噪声样本获得含噪样本,并计算所述含噪样本的抑制准则;
[0012]通过所述含噪样本以及所述含噪样本的抑制准则,训练所述语音增强模型,直到所述语音增强模型对所述含噪样本的输出结果满足预设条件。
[0013]在一个实施例中,所述计算所述含噪样本的抑制准则,包括:
[0014]计算所述干净语音样本与所述含噪样本的比值,获得所述含噪样本的抑制准则。
[0015]在一个实施例中,所述所述语音增强模型对所述含噪样本的输出结果满足预设条件,包括:
[0016]根据所述输出结果计算所述含噪样本的增强语音;
[0017]通过代价函数计算所述增强语音与所述含噪样本对应的干净语音样本之间的差异,在所述差异小于预设值时,所述语音增强模型的所述输出结果满足预设条件。
[0018]在一个实施例中,所述方法还包括:
[0019]确定所述语音增强模型的感知权重参数;
[0020]基于所述感知权重参数构建所述代价函数。
[0021]在一个实施例中,所述语音增强模型包括第一深度神经网络、第二深度神经网络与第三深度神经网络,所述将所述语音样本输入到训练后的语音增强模型,获得所述语音增强模型输出的抑制准则,包括:
[0022]将所述语音样本输入到第一深度神经网络与第二深度神经网络中,所述第一深度神经网络用于输出所述语音样本的预测干净语音,所述第二深度神经网络用于输出所述语音样本的语音存在概率;
[0023]基于所述语音样本、所述预测干净语音以及所述语音存在概率计算先验信噪比和后验信噪比;
[0024]将所述先验信噪比与所述后验信噪比输入所述第三深度神经网络,获得所述第三神经网络输出的抑制准则。
[0025]在一个实施例中,所述基于所述抑制准则对所述语音样本进行增强处理,获得增强后的语音信号,包括:
[0026]将所述抑制准则与所述语音样本相乘,得到增强后的所述语音信号。
[0027]第二方面,本申请实施例提供一种语音增强装置,包括:
[0028]信号获取模块,用于获取包含噪声的语音样本;
[0029]抑制准则输出模块,用于将所述语音样本输入到训练后的语音增强模型,获得所述语音增强模型输出的抑制准则;
[0030]信号增强模块,用于基于所述抑制准则对所述语音样本进行增强处理,获得增强后的语音信号。
[0031]第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的语音增强方法。
[0032]第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的语音增强方法。
[0033]本申请实施例提供的语音增强方法、语音增强装置及电子设备,通过模型来学习语音样本中噪声的抑制准则,从而根据该抑制准则对语音样本进行增强处理。模型通过离线训练能够记住噪声的特征,从而有效地抑制噪声。与现有技术中通过模型直接输出干净语音的方式相比,可以避免对语音信号引入噪声导致的语音失真问题,能够提高语音增强的质量,提高增强后语音信号的可懂度(清晰度)。
附图说明
[0034]为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本申请实施例提供的语音增强方法的流程示意图之一;
[0036]图2是本申请实施例提供的语音增强方法的流程示意图之二;
[0037]图3是本申请实施例提供的语音增强方法的流程示意图之三;
[0038]图4是本申请实施例提供的语音增强模型的架构示意图;
[0039]图5是本申请实施例提供的语音增强方法的流程示意图之四;
[0040]图6是本申请实施例提供的语音增强装置的结构示意图;
[0041]图7是本申请实施例提供的电子设备的结构示意图;
具体实施方式
[0042]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0043]图1为本申请实施例提供的语音增强方法的流程图。参照图1,本申请实施例提供一种语音增强方法,可以包括:
[0044]步骤10:获取包含噪声的语音样本。
[0045]语音样本可以指录音设备采集的语音信号。在真实场景下的语音信号通常包含很多噪声。通过语音增强处理可以增强语音信号中的语音,抑制噪声,从而使得语音信号更加清晰。需要进行语音增强处理的任何语音信号均可以作为语音样本。
[0046]步骤20:将所述语音样本输入到训练后的语音增强模型,获得所述语音增强模型输出的抑制准则。
[0047]语音增强模型可以包括深度神经网络(Deep Neural Networks,DNN)模型。本实施方式中,预先构建语音增强模型,并对该语音增强模型进行训练。然后,将需要进行语音增强处理的语音样本输入到训练后的语音增强模型中,获得该模型输出的针对该语音样本的抑制准则。
[0048]示例性的,先将语音样本先进行分帧、获得语音样本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法,其特征在于,包括:获取包含噪声的语音样本;将所述语音样本输入到训练后的语音增强模型,获得所述语音增强模型输出的抑制准则;基于所述抑制准则对所述语音样本进行增强处理,获得增强后的语音信号。2.根据权利要求1所述的语音增强方法,其特征在于,所述方法还包括:获取干净语音样本以及噪声样本;基于所述干净语音样本以及所述噪声样本获得含噪样本,并计算所述含噪样本的抑制准则;通过所述含噪样本以及所述含噪样本的抑制准则,训练所述语音增强模型,直到所述语音增强模型对所述含噪样本的输出结果满足预设条件。3.根据权利要求2所述的语音增强方法,其特征在于,所述计算所述含噪样本的抑制准则,包括:计算所述干净语音样本与所述含噪样本的比值,获得所述含噪样本的抑制准则。4.根据权利要求2所述的语音增强方法,其特征在于,所述所述语音增强模型对所述含噪样本的输出结果满足预设条件,包括:根据所述输出结果计算所述含噪样本的增强语音;通过代价函数计算所述增强语音与所述含噪样本对应的干净语音样本之间的差异,在所述差异小于预设值时,所述语音增强模型的所述输出结果满足预设条件。5.根据权利要求4所述的语音增强方法,其特征在于,所述方法还包括:确定所述语音增强模型的感知权重参数;基于所述感知权重参数构建所述代价函数。6.根据权利要求1所述的语音增强方法,其特征在于,所述语音增强模型包括第一深度神经网络、第二深度神经...

【专利技术属性】
技术研发人员:房慧保秦鹏秦晓飞
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1