自适应降噪的方法、装置和计算机设备制造方法及图纸

技术编号:38527694 阅读:11 留言:0更新日期:2023-08-19 17:03
本发明专利技术提供了一种自适应降噪的方法、装置和计算机设备,包括:获取语音数据;其中,所述语音数据中至少携带有背景声音信息;对所述语音数据进行解析,得到所述背景声音信息;将所述背景声音信息,输入至分类模型中进行分类,得到对应的分类结果;其中,所述分类模型为预先训练完成的神经网络模型;获取所述分类结果对应的标识信息;检测数据库中是否存在与所述标识信息相同的目标标识字段;若存在,则根据所述目标标识字段确定对应的目标降噪模型;基于所述目标降噪模型,对所述语音数据进行降噪处理。本发明专利技术基于语音数据中背景的不同,确定对应的目标降噪模型进行降噪处理,克服了目前的智能语音设备不能适应背景进行降噪处理的缺陷。缺陷。缺陷。

【技术实现步骤摘要】
自适应降噪的方法、装置和计算机设备


[0001]本专利技术涉及语音降噪
,特别涉及一种自适应降噪的方法、装置和计算机设备。

技术介绍

[0002]目前,在智能语音设备中,具有语音采集功能;智能语音设备在进行语音采集的同时,会采集到多种噪声对用户的声音产生干扰;为了去除噪声,智能语音设备会进行一些降噪处理,目前的降噪处理方式较为固定,通常只能在部分背景下取得较好的降噪效果,但是在其他背景中则效果不佳;降噪效果不好的情况下,造成智能语音设备的语音采集效果较差。

技术实现思路

[0003]本专利技术的主要目的为提供一种自适应降噪的方法、装置和计算机设备,旨在解决目前的智能语音设备不能适应背景进行降噪处理的缺陷。
[0004]为实现上述目的,本专利技术提供了一种自适应降噪的方法,包括以下步骤:获取语音数据;其中,所述语音数据中至少携带有背景声音信息;对所述语音数据进行解析,得到所述背景声音信息;将所述背景声音信息,输入至分类模型中进行分类,得到对应的分类结果;其中,所述分类模型为预先训练完成的神经网络模型;获取所述分类结果对应的标识信息;检测数据库中是否存在与所述标识信息相同的目标标识字段;若存在,则根据所述目标标识字段确定对应的目标降噪模型;基于所述目标降噪模型,对所述语音数据进行降噪处理。
[0005]进一步地,所述根据所述目标标识字段确定对应的目标降噪模型的步骤,包括:对所述目标标识字段进行解析,得到第一特征信息以及第二特征信息;其中,所述第一特征信息为所述目标标识字段中第一指定位置上的字符信息,所述第二特征信息为所述目标标识字段中第二指定位置上的字符信息;基于数据库中存储的特征信息与降噪模型的对应关系,确定所述第一特征信息对应的目标降噪模型;向管理终端发送携带有所述第二特征信息的调用指令;其中,所述调用指令用于调用确定出的所述目标降噪模型。
[0006]进一步地,所述根据所述目标标识字段确定对应的目标降噪模型的步骤,包括:基于数据库中存储的标识字段与模型参数集合的对应关系,匹配所述目标标识字段对应的目标模型参数集合;其中,所述目标模型参数集合中包括多个模型参数,所述模型参数至少包括平滑队列长度、平滑机制参数;随机调用一个降噪模型,并将所述降噪模型中的模型参数对应更换为所述目标模
型参数集合中的模型参数,得到所述目标降噪模型。
[0007]进一步地,所述分类模型的训练过程,包括:获取初始的神经网络模型,以及获取训练数据;其中,所述训练数据为背景声音训练数据及其对应的标签;初始的神经网络模型包括特征提取层、编码层、解码层、分类层;基于所述特征提取层对所述背景声音训练数据进行特征提取,得到第一声音特征;将所述第一声音特征输入至所述编码层进行编码,得到第一编码特征;并将所述第一编码特征输入至所述解码层进行解码,得到第二声音特征;将所述第二声音特征输入至所述编码层进行编码,得到第二编码特征;将所述第一编码特征、第二编码特征以及所述背景声音训练数据对应的标签共同输入至所述分类层进行迭代训练,直至模型收敛得到所述分类模型。
[0008]进一步地,所述分类模型的训练过程,包括:获取第一神经网络模型以及第二神经网络模型,以及获取训练数据;其中,所述训练数据为背景声音训练数据及其对应的标签;所述第一神经网络模型包括特征提取层、编码层、解码层、分类层,所述第二神经网络模型包括特征提取层、编码层、分类层;基于所述第一神经网络模型的特征提取层对所述背景声音训练数据进行特征提取,得到第一声音特征;将所述第一声音特征输入至所述第一神经网络模型的编码层进行编码,得到第一编码特征;并将所述第一编码特征输入至所述解码层进行解码,得到第二声音特征;将所述第二声音特征输入至所述第二神经网络模型的编码层进行编码,得到第二编码特征;将所述第一编码特征以及所述背景声音训练数据对应的标签输入至所述第一神经网络模型的分类层进行迭代训练,直至模型收敛得到第一分类模型;将所述第二编码特征以及所述背景声音训练数据对应的标签输入至所述第二神经网络模型的分类层进行迭代训练,直至模型收敛得到第二分类模型;将测试集分别输入至所述第一分类模型、第二分类模型中进行分类,得到第一分类结果以及第二分类结果;判断所述第一分类结果以及第二分类结果是否均与所述测试集中的标签相同;若均相同,则将所述第一分类模型作为所述分类模型。
[0009]进一步地,所述基于所述目标降噪模型,对所述语音数据进行降噪处理的步骤之后,包括:获取降噪后的语音数据;对所述降噪后的语音数据进行文字识别,得到关键词;在所述语音数据中,获取所述关键词对应的多帧语音数据;将所述关键词输入至词嵌入模型中,提取所述关键词对应的词向量;依次将所述关键词对应的多帧语音数据输入至预设的神经网络中,提取每帧语音数据对应的向量;将每帧语音数据对应的向量进行求和,得到和向量;调整所述预设的神经网络的网络参数,并通过余弦函数对所述和向量与所述词向量进行拟合,以训练预设的神经网络;在所述和向量与所述词向量完成拟合时,得到关键词
语音识别模型;其中,所述关键词语音识别模型用于对语音信息进行关键词识别。
[0010]本专利技术还提供了一种自适应降噪的装置,包括:第一获取单元,用于获取语音数据;其中,所述语音数据中至少携带有背景声音信息;解析单元,用于对所述语音数据进行解析,得到所述背景声音信息;分类单元,用于将所述背景声音信息,输入至分类模型中进行分类,得到对应的分类结果;其中,所述分类模型为预先训练完成的神经网络模型;第二获取单元,用于获取所述分类结果对应的标识信息;确定单元,用于检测数据库中是否存在与所述标识信息相同的目标标识字段;若存在,则根据所述目标标识字段确定对应的目标降噪模型;降噪单元,用于基于所述目标降噪模型,对所述语音数据进行降噪处理。
[0011]进一步地,所述确定单元包括:解析子单元,用于对所述目标标识字段进行解析,得到第一特征信息以及第二特征信息;其中,所述第一特征信息为所述目标标识字段中第一指定位置上的字符信息,所述第二特征信息为所述目标标识字段中第二指定位置上的字符信息;确定子单元,用于基于数据库中存储的特征信息与降噪模型的对应关系,确定所述第一特征信息对应的目标降噪模型;调用子单元,用于向管理终端发送携带有所述第二特征信息的调用指令;其中,所述调用指令用于调用确定出的所述目标降噪模型。
[0012]进一步地,所述确定单元包括:匹配子单元,用于基于数据库中存储的标识字段与模型参数集合的对应关系,匹配所述目标标识字段对应的目标模型参数集合;其中,所述目标模型参数集合中包括多个模型参数,所述模型参数至少包括平滑队列长度、平滑机制参数;更换子单元,用于随机调用一个降噪模型,并将所述降噪模型中的模型参数对应更换为所述目标模型参数集合中的模型参数,得到所述目标降噪模型。
[0013]本专利技术还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0014]本专利技术还提供一种计算机可读本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应降噪的方法,其特征在于,包括以下步骤:获取语音数据;其中,所述语音数据中至少携带有背景声音信息;对所述语音数据进行解析,得到所述背景声音信息;将所述背景声音信息,输入至分类模型中进行分类,得到对应的分类结果;其中,所述分类模型为预先训练完成的神经网络模型;获取所述分类结果对应的标识信息;检测数据库中是否存在与所述标识信息相同的目标标识字段;若存在,则根据所述目标标识字段确定对应的目标降噪模型;基于所述目标降噪模型,对所述语音数据进行降噪处理。2.根据权利要求1所述的自适应降噪的方法,其特征在于,所述根据所述目标标识字段确定对应的目标降噪模型的步骤,包括:对所述目标标识字段进行解析,得到第一特征信息以及第二特征信息;其中,所述第一特征信息为所述目标标识字段中第一指定位置上的字符信息,所述第二特征信息为所述目标标识字段中第二指定位置上的字符信息;基于数据库中存储的特征信息与降噪模型的对应关系,确定所述第一特征信息对应的目标降噪模型;向管理终端发送携带有所述第二特征信息的调用指令;其中,所述调用指令用于调用确定出的所述目标降噪模型。3.根据权利要求1所述的自适应降噪的方法,其特征在于,所述根据所述目标标识字段确定对应的目标降噪模型的步骤,包括:基于数据库中存储的标识字段与模型参数集合的对应关系,匹配所述目标标识字段对应的目标模型参数集合;其中,所述目标模型参数集合中包括多个模型参数,所述模型参数至少包括平滑队列长度、平滑机制参数;随机调用一个降噪模型,并将所述降噪模型中的模型参数对应更换为所述目标模型参数集合中的模型参数,得到所述目标降噪模型。4.根据权利要求1所述的自适应降噪的方法,其特征在于,所述分类模型的训练过程,包括:获取初始的神经网络模型,以及获取训练数据;其中,所述训练数据为背景声音训练数据及其对应的标签;初始的神经网络模型包括特征提取层、编码层、解码层、分类层;基于所述特征提取层对所述背景声音训练数据进行特征提取,得到第一声音特征;将所述第一声音特征输入至所述编码层进行编码,得到第一编码特征;并将所述第一编码特征输入至所述解码层进行解码,得到第二声音特征;将所述第二声音特征输入至所述编码层进行编码,得到第二编码特征;将所述第一编码特征、第二编码特征以及所述背景声音训练数据对应的标签共同输入至所述分类层进行迭代训练,直至模型收敛得到所述分类模型。5.根据权利要求1所述的自适应降噪的方法,其特征在于,所述分类模型的训练过程,包括:获取第一神经网络模型以及第二神经网络模型,以及获取训练数据;其中,所述训练数据为背景声音训练数据及其对应的标签;所述第一神经网络模型包括特征提取层、编码层、
解码层、分类层,所述第二神经网络模型包括特征提取层、编码层、分类层;基于所述第一神经网络模型的特征提取层对所述背景声音训练数据进行特征提取,得到第一声音特征;将所述第一声音特征输入至所述第一神经网络模型的编码层进行编码,得到第一编码特征;并将所述第一编码特征输入至所述解码层进行解码,得到第二声音特征;将所述第二声音特征输入至所述第二神经网络模型的编码层进行编码,得到第二编码特征;将所述第一编码特征以及所述背景声音训练数据对应的标签输入至所述第一...

【专利技术属性】
技术研发人员:薛兴韩林宗华高桂冰
申请(专利权)人:深圳市则成电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1