语音降噪方法和装置制造方法及图纸

技术编号：30424812 阅读：22 留言：0更新日期：2021-10-24 16:55

本申请提供了一种语音降噪的方法和装置，该方法包括：获取M个第一语音频谱信号；对该M个第一语音频谱信号进行第一滤波降噪处理，得到M个第一降噪信号；根据该M个第一降噪信号中的每个第一降噪信号，确定第一掩码信息，该第一掩码信息用于表示该每个第一降噪信号中包括的多个频点中的每个频点属于第一目标频点的概率值，该第一目标频点包括预设的第一目标语音的频谱信号中包括的频点；根据该第一掩码信息，对该M个第一语音频谱信号进行第二滤波降噪处理，得到M个第二降噪信号，该M个第二降噪信号用于识别该第一语音中是否包含该第一目标语音。采用本申请提供的语音降噪方法和装置，能够提高语音信号的信噪比，从而提高语音识别的精确性。识别的精确性。识别的精确性。

全部详细技术资料下载

【技术实现步骤摘要】
语音降噪方法和装置

[0001]本申请涉及音频处理
，并且更具体地，涉及音频处理
中的语音降噪方法和装置。

技术介绍

[0002]随着人工智能的发展，人机交互在移动设备或者穿戴设备(如平板、手机)上使用已经相当广泛，越来越多的人使用语音交互。语音唤醒和语音识别技术是实现语音交互的关键技术。
[0003]当前，语音唤醒和语音识别技术在高信噪比下已经有非常好的性能，但是在强嘈杂环境下，比如电视噪声和音乐噪声等，唤醒率和识别率较低，语音交互体验受到严重影响。
[0004]因此，如何提高语音信号的信噪比，从而提高语音交互体验成为亟待解决的问题。

技术实现思路

[0005]本申请提供一种语音降噪方法和装置，能够提高语音信号的信噪比，从而提高语音识别的精确性。
[0006]第一方面，本申请实施例提供一种语音降噪方法，该方法包括：获取M个第一语音频谱信号，所述M个第一语音频谱信号是通过N个麦克风对用户的第一语音进行采集得到的，M和N均为大于1的整数，且N大于或等于M；对所述M个第一语音频...

【技术保护点】

【技术特征摘要】
1.一种语音降噪方法，其特征在于，包括：获取M个第一语音频谱信号，所述M个第一语音频谱信号是通过N个麦克风对用户的第一语音进行采集得到的，M和N均为大于1的整数，且N大于或等于M；对所述M个第一语音频谱信号进行第一滤波降噪处理，得到M个第一降噪信号；根据所述M个第一降噪信号中的每个第一降噪信号，确定第一掩码信息，所述第一掩码信息用于表示所述每个第一降噪信号中包括的多个频点中的每个频点属于第一目标频点的概率值，所述第一目标频点包括预设的第一目标语音的频谱信号中包括的频点；根据所述第一掩码信息，对所述M个第一语音频谱信号进行第二滤波降噪处理，得到M个第二降噪信号，所述M个第二降噪信号用于识别所述第一语音中是否包含所述第一目标语音。2.根据权利要求1所述的方法，其特征在于，所述根据所述M个第一降噪信号中的每个第一降噪信号，确定第一掩码信息，包括：将所述M个第一降噪信号中的每个第一降噪信号的频谱特征信息输入第一神经网络模型，得到所述第一掩码信息，所述每个第一降噪信号的频谱特征信息用于表示所述每个第一降噪信号的频谱分布特征，其中，所述第一神经网络模型是根据第一训练数据样本集训练得到的，所述第一训练数据样本集中包括至少一个第一样本数据组，所述至少一个第一样本数据组中的每个第一样本数据组包括第一样本语音频谱信号的频谱特征信息和与所述第一样本语音频谱信号对应的第二样本语音频谱信号的频谱特征信息，所述第一样本语音频谱信号包括所述第一目标语音，所述第二样本语音频谱信号包括所述第一样本语音频谱信号和噪声。3.根据权利要求1或2所述的方法，其特征在于，当M大于N时，所述获取M个第一语音频谱信号，包括：接收所述N个麦克风对所述第一语音进行采集得到的N个第二语音信号，所述N个麦克风与所述N个第二语音信号一一对应；对所述N个第二语音信号进行频域转换，得到N个第二语音频谱信号；对所述N个第二语音频谱信号进行第一处理，得到所述M个第一语音频谱信号，其中，所述第一处理包括波达方向处理或波束成形处理。4.根据权利要求1或2所述的方法，其特征在于，当M等于N时，所述获取M个第一语音频谱信号，包括：接收所述N个麦克风对所述第一语音进行采集得到的N个第一语音信号，所述N个麦克风与所述N个第一语音信号一一对应；对所述N个第一语音信号进行频域转换，得到所述M个第一语音频谱信号。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述方法还包括：根据所述M个第二降噪信号对所述第一语音进行语音识别，以确定所述第一语音中是否包含所述第一目标语音。6.根据权利要求5所述的方法，其特征在于，当确定所述第一语音中包含所述第一目标语音时，所述方法还包括：获取M个第三语音频谱信号，所述M个第三语音频谱信号是通过所述N个麦克风对所述用户的第二语音进行采集得到的；
根据所述第二滤波降噪处理所使用的滤波系数，对所述M个第三语音频谱信号进行第三滤波降噪处理，得到M个第三降噪信号；根据M个第二目标降噪信号，对所述M个第三降噪信号进行降噪，得到第四降噪信号，所述第四降噪信号用于识别所述第二语音中是否包含预设的第二目标语音，所述M个第二目标降噪信号为所述M个第二降噪信号中与所述第一目标语音对应的部分。7.根据权利要求6所述的方法，其特征在于，所述根据M个第二目标降噪信号，对所述M个第三降噪信号进行降噪，得到第四降噪信号，包括：从所述M个第二目标降噪信号中确定出第二参考降噪信号，所述第二参考降噪信号为所述M个第二目标降噪信号中识别出所述第一目标语音的概率最大的第二目标降噪信号；根据所述每个第二降噪信号与所述第二参考降噪信号之间的相似度，确定所述每个第二降噪信号的加权值；根据所述M个第二降噪信号中每个第二降噪信号的加权值，对所述M个第二降噪信号进行加权，得到第一加权降噪信号；根据所述M个第二降噪信号中每个第二降噪信号的加权值，对所述M个第三降噪信号进行加权，得到第二加权降噪信号；根据所述第一加权降噪信号，对所述第二加权降噪信号进行降噪，得到所述第四降噪信号。8.根据权利要求7所述的方法，其特征在于，所述根据所述第一加权降噪信号，对所述第二加权降噪信号进行降噪，得到所述第四降噪信号，包括：确定所述第一加权降噪信号的特征信息，所述特征信息包括所述用户的声纹特征或位置特征；根据所述第一加权降噪信号的特征信息，对所述第二加权降噪信号进行降噪，得到所述第四降噪信号。9.根据权利要求6至8中任一项所述的方法，其特征在于，在所述获取M个第三语音频谱信号之前，所述方法还包括：确定所述M个第二目标降噪信号中每个第二目标降噪信号的掩码值，所述每个第二目标降噪信号的掩码值为所述每个第二目标降噪信号包括的多个频点中每个频点属于所述第一目标频点的概率值之和，且所述每个第二目标降噪信号的掩码值越大，所述每个第二目标降噪信号中识别出所述第一目标语音的概率越大；当所述M个第二目标降噪信号中的至少一个第二目标降噪信号的掩码值大于或等于预设的掩码值阈值时，确定所述M个第二目标降噪信号中包含所述第一目标语音。10.根据权利要求6至9中任一项所述的方法，其特征在于，所述第一目标语音为唤醒词，所述唤醒词用于唤醒终端，所述第二目标语音为第一控制指令，所述第一控制指令用于控制所述终端执行与所述第一控制指令对应的操作；或，所述第一目标语音为第二控制指令，所述第二控制指令用于控制所述终端执行与所述第二控制指令对应的操作。11.一种语音降噪装置，其特征在于，包括：获取单元，用于获取M个第一语音频谱信号，所述M个第一语音频谱信号是通过N个麦克风对用户的第一语音进行采集得到的，M和N均为大于1的整数，且N大于或等于M；
第一滤波单元，用于对所述M个第一语音频谱信号进行第一滤波降噪处理，得到M个第一降噪信号；处理单元，用于根据所述M个第一降噪信...

【专利技术属性】
技术研发人员：廖猛，范泛，陈伟宾，吴超，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人