语音信号去混响处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：25124774 阅读：44 留言：0更新日期：2020-08-05 02:53

本申请涉及基于机器学习的一种语音信号去混响处理方法、装置、计算机设备和存储介质。所述方法包括：获取原始语音信号，提取所述原始语音信号中当前帧的幅度谱特征和相位谱特征；提取所述幅度谱特征的子带幅度谱，将所述子带幅度谱输入至第一混响预测器，输出所述当前帧对应的混响强度指标；利用第二混响预测器根据所述子带幅度谱和所述混响强度指标确定所述当前帧的纯净语音子带谱；对所述纯净语音子带谱和所述相位谱特征进行信号转换，得到去混响后的纯净语音信号。采用本方法能够有效提高语音信号的消除混响的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音信号去混响处理方法、装置、计算机设备和存储介质
本申请涉及通信
，特别是涉及一种语音信号去混响处理方法、装置、计算机设备和存储介质。
技术介绍
随着计算机通信技术的迅速发展，出现了基于VoIP(VoiceoverInternetProtocol，基于IP的语音传输)的语音通话技术，经由互联网来进行通信，以实现语音通话和多媒体会议等通信功能。在基于VoIP点对点通话或者多人在线电话会议中，由于说话人距离麦克风远或者室内声学环境欠佳导致的混响声，会导致语音不清晰，影响语音通话质量。通过对单通道语音去混响，可以提高语言通话质量。传统单通道语音去混响技术，需通过获取过去一段时间的历史帧信息，利用最优维纳解、LPC预测、自回归模型、统计模型等方式预测当前帧混响信息。这些预测手段往往依赖语音混响成分的统计平稳性或短时平稳性假设，但对包括早期反射声在内的早期混响无法准确估计。对于环境不断变换的通信场景，通常是采用基于历史帧信息混响估计方式进行混响估计，这种方式对混响程度估计存在一定误差，导致对单通道语音中的混响消除的准确

【技术保护点】
1.一种语音信号去混响处理方法，其特征在于，所述方法包括：/n获取原始语音信号，提取所述原始语音信号中当前帧的幅度谱特征和相位谱特征；/n提取所述幅度谱特征的子带幅度谱，将所述子带幅度谱输入至第一混响预测器，输出所述当前帧对应的混响强度指标；/n利用第二混响预测器根据所述子带幅度谱和所述混响强度指标确定所述当前帧的纯净语音子带谱；/n对所述纯净语音子带谱和所述相位谱特征进行信号转换，得到去混响后的纯净语音信号。/n

【技术特征摘要】
1.一种语音信号去混响处理方法，其特征在于，所述方法包括：
获取原始语音信号，提取所述原始语音信号中当前帧的幅度谱特征和相位谱特征；
提取所述幅度谱特征的子带幅度谱，将所述子带幅度谱输入至第一混响预测器，输出所述当前帧对应的混响强度指标；
利用第二混响预测器根据所述子带幅度谱和所述混响强度指标确定所述当前帧的纯净语音子带谱；
对所述纯净语音子带谱和所述相位谱特征进行信号转换，得到去混响后的纯净语音信号。

2.根据权利要求1所述的方法，其特征在于，所述将所述子带幅度谱输入至第一混响预测器，输出所述当前帧对应的混响强度指标包括：
利用第一混响预测器预测所述当前帧中各个子带的纯净语音能量比；
根据所述各个子带的纯净语音能量比确定所述当前帧对应的混响强度指标。

3.根据权利要求2所述的方法，其特征在于，所述第一混响预测器包括输入层、预测层和输出层，所述将所述子带幅度谱输入至已训练的第一混响预测器，输出所述当前帧对应的混响强度指标包括：
通过所述输入层提取各个子带幅度谱的维度特征；
利用所述预测层根据所述维度特征提取各个子带幅度谱的表征信息，根据所述表征信息确定各个子带幅度谱的纯净语音能量比；
利用所述输出层根据所述各个子带对应的纯净语音能量比输出所述当前帧对应的混响强度指标。

4.根据权利要求1所述的方法，其特征在于，所述利用第二混响预测器根据所述子带幅度谱和所述混响强度指标确定所述当前帧的纯净语音子带谱包括：
利用所述第二混响预测器根据所述当前帧的幅度谱特征确定所述当前帧的后验信干比；
利用所述后验信干比和所述混响强度指标计算所述当前帧的先验信干比；
利用所述先验信干比对所述当前帧的子带幅度谱进行滤波增强处理，得到所述当前帧的纯净语音子带幅度谱。

5.根据权利要求4所述的方法，其特征在于，所述利用所述第二混响预测器根据所述当前帧的幅度谱特征确定所述当前帧的后验信干比包括：
利用所述第二混响提取所述当前帧中各个子带对应的稳态噪声幅度谱；
利用所述第二混响提取所述当前帧中各个子带对应的稳态混响幅度谱；
利用所述稳态噪声幅度谱、所述稳态混响幅度谱和所述子带幅度谱确定所述当前帧的后验信干比。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：
获取上一帧的纯净语音幅度谱；
基于所述上一帧的纯净语音幅度谱，利用所述稳态噪声幅度谱、所述稳态混响幅度谱和所述子带幅度谱确定所述当前帧的后验信干比。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：
对所述原始语音信号进行分帧加窗处理，得到所述原始语音信号中当前帧对应的幅度谱特征和相位谱特征；
获取预设频带系数，根据所述频带系数对所述当前帧的幅度谱特征进行频带划分，得到所述当前帧对应的子带幅度谱。

8.根据权利要求7所述的方法，其特征在于，所述对所述纯净语音子带谱和所述相位谱特征进行信号转换，得到去混响后的纯...

【专利技术属性】
技术研发人员：朱睿，李娟娟，王燕南，李岳鹏，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人