一种基于贪婪深度字典学习的单信道语音去混响方法技术

技术编号：22002984 阅读：20 留言：0更新日期：2019-08-31 06:10

本发明专利技术提供的是一种基于贪婪深度字典学习的单信道语音去混响方法。步骤一、将输入的混沌、纯净语音进行信号预处理，进行特征的提取；步骤二、结合稀疏和贪婪深度字典学习对单信道语音去混响问题进行模型建立；步骤三、将建立好的模型与提取的特征进行模型训练，得到基本系数；步骤四、再次输入混沌、纯净语音信号数据进行测试，经过傅里叶逆变换后，最终得到纯净语音。本发明专利技术将传统的单信道语音去混响方法与深度字典学习相结合，提高单信道去混响的效果，使其具有良好的去混响效果，提高深度网络结构的可推导性。

A Single Channel Speech Dereverberation Method Based on Greedy Deep Dictionary Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于贪婪深度字典学习的单信道语音去混响方法
本专利技术涉及的是一种单信道去混响方法。
技术介绍
混响是指在声学上，除延迟时间达到约50ms以上的反应波称为回声外，其余的反射波产生的效应统称为混响。随着互联网发展及智能设备的普及，语音或声音信号的可理解性与可感知性对于人机交互的用户体验变得尤为重要。然而混响严重影响了语音识别的准确率，降低了用户智能交互的体验，同时增加了有听力障碍者对于语音理解的困难度。语音去混响的目的是抑制或移除混响语音中的混响成分，尽可能的实现源信号的恢复。根据系统麦克风的数量分为：单信道语音去混响和多信道语音去混响。其中单信道语音去混响利用接收位置一点的语音信号时频域特性作为先验信息对混响信号进行处理，具有系统相对简单，计算复杂度低以及成本较为低廉等优势。因此，单信道语音去混响问题具有重要的研究价值。传统的单信道语音去混响的方法大多通过先建立语音去混响模型，通过加入不同的约束条件在非适定问题中求出可确定的解，从而获得符合条件的估计信号。尽管在求解估计信号时具有可解释性，但这些方法都存在适用范围不足，实际效果不佳等缺点。基于深度学习的语音去混响方法通过训练大量样本，直接学习混响语音和纯净语音之间的非线性映射关系。虽然能取得很好的去混响结果，但具有数据获得困难和参数冗余的缺点，导致其在实际应用中性能下降。
技术实现思路
本专利技术的目的在于提供一种能够提高单信道去混响效果的基于贪婪深度字典学习的单信道语音去混响方法。本专利技术的目的是这样实现的：步骤一、将输入的混沌、纯净语音进行信号预处理，进行特征的提取；步骤二、结合稀疏和贪婪深度字典学习...

【技术保护点】
1.一种基于贪婪深度字典学习的单信道语音去混响方法，其特征是：步骤一、将输入的混沌、纯净语音进行信号预处理，进行特征的提取；步骤二、结合稀疏和贪婪深度字典学习对单信道语音去混响问题进行模型建立；步骤三、将建立好的模型与提取的特征进行模型训练，得到基本系数；步骤四、再次输入混沌、纯净语音信号数据进行测试，经过傅里叶逆变换后，最终得到纯净语音。

【技术特征摘要】
1.一种基于贪婪深度字典学习的单信道语音去混响方法，其特征是：步骤一、将输入的混沌、纯净语音进行信号预处理，进行特征的提取；步骤二、结合稀疏和贪婪深度字典学习对单信道语音去混响问题进行模型建立；步骤三、将建立好的模型与提取的特征进行模型训练，得到基本系数；步骤四、再次输入混沌、纯净语音信号数据进行测试，经过傅里叶逆变换后，最终得到纯净语音。2.根据权利要求1所述的基于贪婪深度字典学习的单信道语音去混响方法，其特征是所述的结合稀疏和贪婪深度字典学习对单信道语音去混响问题进行模型建立具体包括：第1、对单信道语音去混响进行建模，具体描述为：(1)将n时刻的语音信号利用下式进行描述：其中D是原始语音，nk是k次反射后的延时单元数，ρk是第k次反射时的发射系数，s(n-knk)是第k次反射后的语音信号，u(n)表示周围环境的噪声，x(n)表示混响语音；(2)将环境噪声u(n)去掉简化得：(3)根据单位冲激函数的卷积性质，改为卷积的形式：其中，h(n)是冲击响应,*是卷积操作符号，δ(n)表示单位冲激函数，h(n)反应混响的物理特征、是位于knk并且都衰减ρk倍后的许多冲击函数δ(n)的叠加，房间脉冲响应h(n)和纯净语音s(n)卷积后获得混响语音x(n)；第2、将单信道语音去混响模型转化为基于稀疏表示的单信道语音去混响模型，其转化过程如下：(1)通过稀疏表示方法对单信道语音去混响进行建模分析，在忽略环境噪声的情况下，利用下式简单描述语音去混响问题：Y＝HX其中Y是混响语音，H是RIR，且有X＝AS；(2)根据X＝AS，假定纯净语音含有正交基稀疏矩阵表示矩阵A，则单信道语音去混响的稀疏表示为：其中λ＞0是用于控制稀疏性与测量空间的参数；(3)使用ISTA算法进行求解；第3、引入深度语音字典，将字典学习问题转化为以下两种表示方法，任选其一：方法1，将求解目标函数定义为：X＝DZ其中X是纯净语音，D是语音字典，Z是稀疏表示矩阵；字典学习问题...

【专利技术属性】
技术研发人员：关键，孙建国，刘加贝，袁野，尹晗琦，田野，林尤添，王文博，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人