一种针对声纹识别的语音降噪方法及装置制造方法及图纸

技术编号:21737254 阅读:22 留言:0更新日期:2019-07-31 19:41
本发明专利技术涉及一种针对声纹识别的语音降噪方法及装置,该方法包括:对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图;对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号;对第一模态信号进行降噪,获取降噪后的模态信号;将降噪后的模态信号与所述除所述第一模态之外的模态信号进行相加重构,获取第二语音功率谱图。通过该方案,主要是分离出噪声最多的模态进行降噪处理。如此一来,在实现语音信号降噪处理的同时,还可以尽量避免了有效语音信号的损失,即说话人语音信息的损失,提升声纹识别效果。

A Speech Denoising Method and Device for Voice Mark Recognition

【技术实现步骤摘要】
一种针对声纹识别的语音降噪方法及装置
本专利技术涉及信号处理
,特别涉及一种针对声纹识别的语音降噪方法及装置。
技术介绍
随着现代社会信息的全球化,声纹识别成为语音识别技术研究热点之一。随着互联网的普及,网上用户登录、网上支付等也面临着一定的风险,声纹密码可以在原有密码基础上增加账户的安全性。声纹识别在实际应用中由于周围环境嘈杂,含有较多噪音含量,导致识别效果不佳。这里的噪声主要包括环境噪声和信道噪声。当前,如何提高噪声条件下的声纹识别效果,已经成为了亟待解决的技术问题。
技术实现思路
本专利技术的目的在于,克服现阶段对于含有较高噪音的语音信号进行声纹识别的问题,提供一种针对声纹识别的语音降噪方法及装置。为解决上述技术问题,本专利技术的技术方案所提供的一种针对声纹识别的语音降噪方法,该方法包括:将第一有效语音信号转换为第一时频域特征,具体包括:对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图;对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号,其中第一模态信号为包含噪声能量最多的模态信号;对第一模态信号进行降噪,获取降噪后的模态信号;将降噪后的模态信号与除第一模态之外的模态信号进行相加重构,获取第二语音功率谱图。本专利技术提供的一种针对声纹识别的语音降噪方法,优点在于:对具有噪声的语音信号进行预处理后,进行特征提取,获取第一语音功率谱图后,对第一语音功率谱图进行分解,获取第一模态信号和其他模态信号。其中,第一模态信号为含有噪声能量最多的模态信号。因此,只要对第一模态信号进行降噪,然后与其他模态信号进行相加重构即可。通过该方案,主要是分离出噪声最多的模态进行降噪处理。如此一来,在实现语音信号降噪处理的同时,还可以尽量避免了有效语音信号的损失,即说话人语音信息的损失,提升声纹识别效果。作为上述方法的又一种改进,对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图,具体包括:将具有噪声的语音信号转换为数字信号;对数字信号进行特征提取,获取第一语音功率谱图。作为上述方法的再一种改进,对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号,具体包括:采用集合经验模态分解方法对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号。采用上述进一步方案的有益效果是:采用集合经验模态分解方法对第一语音功率谱图进行分解时,获取的第一模态信号将会是含有最多噪声能量的模态信号。其他模态信号将仅包含极少的噪声能量,对应声纹识别不会造成影响。因此,在后续处理过程中,只要对第一模态信号进行降噪即可。无需对其他模态信号进行降噪处理。作为上述方法的还一种改进,对第一模态信号进行降噪,获取降噪后的模态信号,具体包括:采用小波降噪方法对第一模态信号进行降噪,获取降噪后的模态信号。采用上述进一步方案的有益效果是:利用小波降噪方法可以有效降低模态信号中的加性噪声。作为上述方法的一种改进,将降噪后的模态信号与除第一模态之外的模态信号进行相加重构,获取第二语音功率谱图之后,方法还包括:提取第二语音功率谱图中的声学特征,并根据声学特征,对语音进行声纹识别。采用上述进一步方案的有益效果是:从第二语音功率谱图中的声学特征进行提取后,方便对语音进行声纹识别。实现对说话人语音的准确识别,提升声纹识别效果。本专利技术的技术方案还提供了一种针对声纹识别的语音降噪装置,该装置包括:特征提取单元,用于对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图;分解单元,用于对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号,其中第一模态信号为包含噪声能量最多的模态信号;处理单元,用于对第一模态信号进行降噪,获取降噪后的模态信号;将降噪后的模态信号与除第一模态之外的模态信号进行相加重构,获取第二语音功率谱图。本专利技术提供的一种针对声纹识别的语音降噪装置,优点在于:对具有噪声的语音信号进行预处理后,进行特征提取,获取第一语音功率谱图后,对第一语音功率谱图进行分解,获取第一模态信号和其他模态信号。其中,第一模态信号为含有噪声能量最多的模态信号。因此,只要对第一模态信号进行降噪,然后与其他模态信号进行相加重构即可。通过该方案,主要是分离出噪声最多的模态进行降噪处理。如此一来,在实现语音信号降噪处理的同时,还可以尽量避免了有效语音信号的损失,即说话人语音信息的损失,提升声纹识别效果。作为上述方法进一步的改进,特征提取单元具体用于,将具有噪声的语音信号转换为数字信号;对数字信号进行特征提取,获取第一语音功率谱图。作为上述方法的又一种改进,分解单元具体用于,采用集合经验模态分解方法对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号。采用上述进一步方案的有益效果是:采用集合经验模态分解方法对第一语音功率谱图进行分解时,获取的第一模态信号将会是含有最多噪声能量的模态信号。其他模态信号将仅包含极少的噪声能量,对应声纹识别不会造成影响。因此,在后续处理过程中,只要对第一模态信号进行降噪即可。无需对其他模态信号进行降噪处理。作为上述方法的再一种改进,处理单元具体用于,采用小波降噪方法对第一模态信号进行降噪,获取降噪后的模态信号。采用上述进一步方案的有益效果是:利用小波降噪方法可以有效降低模态信号中的加性噪声。作为上述方法的还一种改进,装置还包括:声纹识别单元,用于提取第二语音功率谱图中的声学特征,并根据声学特征,对语音进行声纹识别。采用上述进一步方案的有益效果是:从第二语音功率谱图中的声学特征进行提取后,方便对语音进行声纹识别。实现对说话人语音的准确识别,提升声纹识别效果。附图说明图1为本专利技术实施例提供的一种针对声纹识别的语音降噪方法流程示意图;图2为本专利技术实施例提供的另一种针对声纹识别的语音降噪方法流程示意图;图3为本专利技术实施例提供的一种针对声纹识别的语音降噪装置结构示意图。具体实施方式以下结合实施例进一步说明本专利技术所提供的技术方案如图1所示,图1为本专利技术实施提供的一种针对声纹识别的语音降噪方法流程示意图,该方法包括:步骤110,对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图。步骤120,对第一语音功率谱图进行分解,获取第一模态信号和除第一模态之外的模态信号。具体的,将第一语音功率谱图进行分解,最终可以获取含有最多噪声能量的第一模态信号,以及除第一模态信号之外的其他模态信号。而其他模态信号所包含的噪声能量都是极少的,不会对分离出的说话人的语音信号造成影响。因此,不需要对其进行降噪处理。只需要对包含噪声能量最多的第一模态信号进行降噪即可。即步骤130。步骤130,对第一模态信号进行降噪,获取降噪后的模态信号。步骤140,将降噪后的模态信号与除第一模态之外的模态信号进行相加重构,获取第二语音功率谱图。将降噪后的模态信号与其他模态信号进行相加重构,然后获取第二语音功率谱图。此时的功率谱图为经过降噪后的功率谱图。后续则可以通过该功率谱实现对声纹识别,提升识别效果。本专利技术实施例提供的一种针对声纹识别的语音降噪方法,对具有噪声的语音信号进行预处理后,进行特征提取,获取第一语音功率谱图后,对第一语音功率谱图进行分解,获取第一模态信号和其他模态信号。其中,第一模态信本文档来自技高网...

【技术保护点】
1.一种针对声纹识别的语音降噪方法,其特征在于,所述方法包括:对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图;对所述第一语音功率谱图进行分解,获取第一模态信号和除所述第一模态之外的模态信号,其中所述第一模态信号为包含噪声能量最多的模态信号;对所述第一模态信号进行降噪,获取降噪后的模态信号;将所述降噪后的模态信号与所述除所述第一模态之外的模态信号进行相加重构,获取第二语音功率谱图。

【技术特征摘要】
1.一种针对声纹识别的语音降噪方法,其特征在于,所述方法包括:对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图;对所述第一语音功率谱图进行分解,获取第一模态信号和除所述第一模态之外的模态信号,其中所述第一模态信号为包含噪声能量最多的模态信号;对所述第一模态信号进行降噪,获取降噪后的模态信号;将所述降噪后的模态信号与所述除所述第一模态之外的模态信号进行相加重构,获取第二语音功率谱图。2.如权利要求1所述的针对声纹识别的语音降噪方法,其特征在于,对具有噪声的语音信号预处理后,进行特征提取,获取第一语音功率谱图,具体包括:将所述具有噪声的语音信号转换为数字信号;对所述数字信号进行特征提取,获取所述第一语音功率谱图。3.如权利要求1所述的针对声纹识别的语音降噪方法,其特征在于,所述对所述第一语音功率谱图进行分解,获取第一模态信号和除所述第一模态之外的模态信号,具体包括:采用集合经验模态分解方法对所述第一语音功率谱图进行分解,获取所述第一模态信号和除所述第一模态之外的模态信号。4.如权利要求1-3任一项所述的针对声纹识别的语音降噪方法,其特征在于,所述对所述第一模态信号进行降噪,获取降噪后的模态信号,具体包括:采用小波降噪方法对所述第一模态信号进行降噪,获取降噪后的模态信号。5.如权利要求4所述的针对声纹识别的语音降噪方法,其特征在于,所述将所述降噪后的模态信号与所述除所述第一模态之外的模态信号进行相加重构,获取第二语音功率谱图之后...

【专利技术属性】
技术研发人员:颜永红王文超徐及
申请(专利权)人:中国科学院声学研究所北京中科信利技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1