语音增强方法、电子设备和存储介质技术

技术编号：33966995 阅读：14 留言：0更新日期：2022-06-30 01:39

本发明专利技术公开一种语音增强方法、电子设备和存储介质。在该方法中，确定待增强的原始语音所对应的倒谱域信号；分解所述倒谱域信号所对应的声门激励分量信号和声道系统分量信号；基于倒谱分析逆系统模块，对所述声门激励分量信号和所述声道系统分量信号进行时域变换和降噪处理；基于降噪后的声门激励分量时域信号和声道系统分量时域信号，合成目标语音。由此，实现了语音分析、合成与降噪三者的有机融合，从而能实现模型复杂度更低、降噪性能更好的语音增强系统。增强系统。增强系统。

全部详细技术资料下载

【技术实现步骤摘要】
语音增强方法、电子设备和存储介质

[0001]本专利技术属于语音增强
，尤其涉及一种语音增强方法、电子设备和存储介质。

技术介绍

[0002]数字语音通信、语音识别、说话人识别等技术已经日趋成熟，并应用于日常生活中。但制约着这些技术进一步发展和应用的瓶颈在于：这些技术在实验室的理想环境下能得到很好的效果，但在日常应用中往往由于环境噪声的干扰而使得语音通信质量、正确识别率大大降低。语音增强技术能去除语音中的干扰噪声，提升语音通话质量、提升语音识别性能。
[0003]语音增强技术的研究已经有数十几年的历史，主要分为基于统计信号处理的传统方法，以及近几年发展的基于深度神经网络的方法。基于深度神经网络的语音增强是一种数据驱动的方法，其主要可以分为短时傅里叶变换域方法、以及网络输入和输出均为时域信号的端到端方法。另一类采用神经网络的方法是将语音降噪模块和生成模型的声码器相结合，得到一种基于声码器的语音降噪系统。
[0004]然而，一方面，基于统计信号处理的语音增强方法，较依赖于噪声估计算法，噪声估计算法能较为准确地估计稳态噪声，但对非稳态噪声的估计表现较差。另一方面，基于深度神经网络的方法，存在依赖大量训练数据的问题，从而导致在开放测试集上降噪效果欠佳。
[0005]针对上述问题，目前业界暂未提供较佳的解决方案。

技术实现思路

[0006]本专利技术实施例提供一种语音增强方法、电子设备和存储介质，用于至少解决上述技术问题之一。
[0007]第一方面，本专利技术实施例提供一种...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法，包括：确定待增强的原始语音所对应的倒谱域信号；分解所述倒谱域信号所对应的声门激励分量信号和声道系统分量信号；基于倒谱分析逆系统模块，对所述声门激励分量信号和所述声道系统分量信号进行时域变换和降噪处理；基于降噪后的声门激励分量时域信号和声道系统分量时域信号，合成目标语音。2.根据权利要求1所述的方法，其中，所述确定待增强的原始语音所对应的倒谱域信号，包括：获取当前的倒谱分析模式；当处于复倒谱分析模式时，确定待增强的原始语音所对应的带相位信息的复倒谱信号；当处于实倒谱分析模式时，确定所述原始语音所对应的无相位信息的实倒谱信号和相位信息。3.根据权利要求2所述的方法，其中，所述基于倒谱分析逆系统模块，对所述声门激励分量信号和所述声道系统分量信号进行时域变换和降噪处理，包括：当处于复倒谱分析模式时，所述倒谱分析逆系统模块采用复倒谱分析逆系统模块，以确定所述复倒谱信号所对应的时域信号；其中，所述复倒谱分析逆系统模块包括顺序级联的傅里叶变换子模块、复指数计算子模块、降噪神经网络和傅里叶反变换子模块；当处于实倒谱分析模式时，所述倒谱分析逆系统模块采用最小相位重建系统，以确定所述实倒谱信号所对应的时域信号；其中，所述最小相位重建系统包括顺序级联的加窗傅里叶变换子模块、指数计算子模块、降噪神经网络和傅里叶反变换子模块。4.根据权利要求3所述的方法，其中，所述复倒谱分析逆系统模块中的降噪神经网络采用复数神经网络结构，以及所述最小相位重建系统中的降噪神经网络采用实数神经网络结构。5.根据权利要求3所述的方法，其中，所述降噪神经网络采用多分辨率短时傅...

【专利技术属性】
技术研发人员：俞凯，江文斌，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人