语音降噪方法、装置、设备及存储介质制造方法及图纸

技术编号:29875853 阅读:22 留言:0更新日期:2021-08-31 23:51
本申请涉及音频处理技术领域,揭露了一种语音降噪方法,包括:获取语音数据,将所述语音数据输入预设的标准场景识别模型,确定所述语音数据对应的语音场景,所述标准场景识别模型为根据各个场景下的噪声样本集训练得到,选择预设的与所述语音场景对应的降噪模型,对所述语音数据进行降噪。此外,本申请还揭露一种语音降噪方法、装置、设备及存储介质。本申请可提高语音降噪的精确度。

【技术实现步骤摘要】
语音降噪方法、装置、设备及存储介质
本申请涉及音频处理
,尤其涉及一种语音降噪方法、装置及存储介质。
技术介绍
现在的生活中充斥着各种各样的噪音音频数据,例如马路边的噪音音频数据、公园里的噪音音频数据和办公室的噪音音频数据等,不同语音场景下噪音音频数据的音频特征不同,与此同时对应采用的语音降噪手段也不相同。现有的语音降噪方法是基于用户声纹特征的降噪,例如,根据用户的声纹特征对语音数据中的用户语音进行增强,以实现对背景噪声的削弱,完成语音降噪。但实际应用场景中,当背景噪声的音量过大时,该方法无法根据对用户语音的增强实现对背景噪声的削弱,导致降噪的精确度不高。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种语音降噪方法、装置及存储介质。第一方面,本申请提供了一种语音降噪方法,所述方法包括:获取语音数据;将所述语音数据输入预设的标准场景识别模型,确定所述语音数据对应的语音场景,所述标准场景识别模型为根据各个场景下的噪声样本集训练得到;选择预设的与所述语音场景对应的降噪模型,对所述语音数据进行降噪。第一方面的其中一个实施例中,获取语音数据的步骤之前,包括:采集各个场景下的噪声样本集,从各个噪声样本中提取音频特征;基于所述音频特征对所述噪声样本集进行聚类分析,得到分类语音集;将所述分类语音集切分为训练语音集和测试语音集,利用所述训练语音集构建所述场景识别模型,并利用所述测试语音集对所述场景识别模型进行测试调整,得到标准场景识别模型。第一方面的其中一个实施例中,将所述分类语音集切分为训练语音集和测试语音集,利用所述训练语音集构建所述场景识别模型,并利用所述测试语音集对所述场景识别模型进行测试调整,得到标准场景识别模型的步骤之后,还包括:根据采集到的各个场景下的噪声样本集,建立与各个场景对应的降噪模型,以供调用。第一方面的其中一个实施例中,所述利用所述训练语音集构建得到场景识别模型,包括:计算每一个特征标注与对应的所述训练语音集之间的基尼指数,得到所述特征标注对应的基尼指数集合,所述特征标注为从各个场景下的噪声样本集中提取得到对应音频特征的类别标注;对所述基尼指数集合按照从大到小的顺序进行排序,选取所述基尼指数集合中最小的基尼指数所对应的标注作为切分点;以所述切分点作为初始决策树的根节点,从所述切分点出发生成子节点并将所述训练语音集分配到所述子节点中,直到将所述特征标注中的所有标注遍历完毕,生成所述初始决策树;对所述初始决策树进行剪枝处理,得到场景识别模型。第一方面的其中一个实施例中,所述对所述初始决策树进行剪枝处理,得到场景识别模型,包括:计算所述初始决策树上所有非叶子节点的表面误差增益值;对所述表面误差增益值小于预设的增益阈值的非叶子节点进行剪枝,得到场景识别模型。第一方面的其中一个实施例中,所述利用所述测试语音集对所述场景识别模型进行测试调整,得到标准场景识别模型,包括:利用所述场景识别模型对所述测试语音集进行场景识别处理,得到所述测试语音集对应的识别结果;当所述测试语音集对应的识别结果与所述测试语音集对应的特征标注不一致时,重新利用所述训练语音集对所述场景识别模型进行训练,直到所述测试语音集对应的识别结果与所述测试语音集对应的特征标注一致时,得到标准场景识别模型。第一方面的其中一个实施例中,所述基于所述音频特征对所述噪声样本集进行聚类分析,得到分类语音集,包括:获取预设的标准特征,计算所述音频特征与所述标准特征之间的条件概率值;按照所述条件概率值的大小对所述噪声样本集中的每个噪声样本进行排序,以预设的音频间隔为划分点对排序后的噪声样本集进行划分,得到分类语音集。第一方面的其中一个实施例中,采集各个场景下的噪声样本集,从各个噪声样本中提取音频特征,包括:对所述噪声样本集进行预加重处理、分帧处理、加窗处理以及快速傅里叶变换,得到所述噪声样本集的短时频谱;对所述短时频谱取模平方,得到所述噪声样本集的功率谱;利用预设的梅尔尺度的三角形滤波器组对所述功率谱进行计算并得到对数能量,对所述对数能量进行离散余弦变换,得到每个噪声样本对应的音频特征。第二方面,本申请提供了一种语音场景识别装置,所述装置包括:语音数据获取模块,用于获取语音数据;语音场景识别模块,用于将所述语音数据输入预设的标准场景识别模型,确定所述语音数据对应的语音场景,所述标准场景识别模型为根据各个场景下的噪声样本集训练得到;降噪模块,用于选择预设的与所述语音场景对应的降噪模型,对所述语音数据进行降噪。第三方面,提供了一种语音识别设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例所述的语音降噪方法的步骤。第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的语音降噪方法的步骤。本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例通过将获取得到的语音数据输入预设的标准场景识别模型中,利用所述标准场景识别模型识别出所述语音数据对应的语音场景,识别所述语音数据对应的语音场景可以确定所述语音数据所处的语音环境,并选择预设的与所述语音场景对应的降噪模型,对所述语音数据进行降噪,通过与场景匹配的降噪模型进行降噪,更加精准地执行了降噪操作,因此,实现了提高语音降噪的精确度的目的。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种语音降噪方法的流程示意图;图2为本申请实施例提供的语音降噪方法中对场景识别模型进行测试调整的流程示意图;图3为本申请实施例提供的一种语音降噪的装置的模块示意图;图4为本申请实施例提供的一种语音降噪的电子设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请实施例提供的一种语音降噪方法的流程示意图。在本实施例中本文档来自技高网...

【技术保护点】
1.一种语音降噪方法,其特征在于,所述方法包括:/n获取语音数据;/n将所述语音数据输入预设的标准场景识别模型,确定所述语音数据对应的语音场景,所述标准场景识别模型为根据各个场景下的噪声样本集训练得到;/n选择预设的与所述语音场景对应的降噪模型,对所述语音数据进行降噪。/n

【技术特征摘要】
1.一种语音降噪方法,其特征在于,所述方法包括:
获取语音数据;
将所述语音数据输入预设的标准场景识别模型,确定所述语音数据对应的语音场景,所述标准场景识别模型为根据各个场景下的噪声样本集训练得到;
选择预设的与所述语音场景对应的降噪模型,对所述语音数据进行降噪。


2.根据权利要求1所述的语音降噪方法,其特征在于,获取语音数据的步骤之前,包括:
采集各个场景下的噪声样本集,从各个噪声样本中提取音频特征;
基于所述音频特征对所述噪声样本集进行聚类分析,得到分类语音集;
将所述分类语音集切分为训练语音集和测试语音集,利用所述训练语音集构建所述场景识别模型,并利用所述测试语音集对所述场景识别模型进行测试调整,得到标准场景识别模型。


3.根据权利要求2所述的语音降噪方法,其特征在于,将所述分类语音集切分为训练语音集和测试语音集,利用所述训练语音集构建所述场景识别模型,并利用所述测试语音集对所述场景识别模型进行测试调整,得到标准场景识别模型的步骤之后,还包括:
根据采集到的各个场景下的噪声样本集,建立与各个场景对应的降噪模型,以供调用。


4.根据权利要求2所述的语音降噪方法,其特征在于,所述利用所述训练语音集构建所述场景识别模型,包括:
计算每一个特征标注与对应的所述训练语音集之间的基尼指数,得到所述特征标注对应的基尼指数集合,所述特征标注为从各个场景下的噪声样本集中提取得到对应音频特征的类别标注;
对所述基尼指数集合按照从大到小的顺序进行排序,选取所述基尼指数集合中最小的基尼指数所对应的标注作为切分点;
以所述切分点作为初始决策树的根节点,从所述切分点出发生成子节点并将所述训练语音集分配到所述子节点中,直到将所述特征标注中的所有标注遍历完毕,生成所述初始决策树;
对所述初始决策树进行剪枝处理,得到场景识别模型。


5.根据权利要求4所述的语音降噪方法,其特征在于,所述对所述初始决策树进行剪枝处理,得到场景识别模型,包括:
计算所述初始决策树上所有非叶子节点的表面误差增益值;
对所述表面误差增益值小于预设的增益阈值的非叶子节点进行剪枝,得到场景识别模型。


6.根据权利要求4所述的语音降噪方法,其特征在于,所述利用所述测试语音集...

【专利技术属性】
技术研发人员:汪雪黄石磊程刚何竹
申请(专利权)人:深圳市北科瑞声科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1