一种语音数据的去混响方法及装置制造方法及图纸

技术编号：14452732 阅读：67 留言：0更新日期：2017-01-18 22:32

本发明专利技术提供一种语音数据的去混响方法，旨在频域对混响语音进行谱减操作以消除混响干扰，主要包括以下步骤：步骤a：对当前语音帧数据进行快速傅里叶变换后，将得到的频谱系数进行复功率计算，其中；步骤b：利用复功率谱计算谱减增益函数，在频域中利用谱减增益函数对混响成分进行抑制；步骤c：快速傅里叶逆变换，得到时域的去除混响的加窗语音帧数据，并进行幅值补偿处理；步骤d：语音帧输出处理。本发明专利技术一种语音数据的去混响方法和装置，对混响语音进行谱减处理，实现语音混响成分的去除。同时，无需环境及信号的先验知识，无应用场景限制，计算强度较低，易于实现并可用于实时传输场合。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于通讯领域，尤其基于移动通讯设备的音频处理技术。
技术介绍
众所周知，麦克风接收的信号易受到环境混响的影响。比如房间内，语音经过墙壁、天花板以及地面等反射，麦克风接收到的信号是直达的声音信号和反射声音信号的混合信号。混响会导致语音质量下降，在语音识别场景中会使系统性能显著下降。现有的去混响方法主要是基于反卷积方法来实现。其中一类方法需要提前知道混响环境的冲击响应或传递函数，然后利用这个传递函数构造一个反向滤波器来恢复原始无混响信号。显然，提前获取混响环境传递函数使该类方法在实际应用中受到很大限制。另一类是基于盲反卷积的方法，该类方法试图利用混响语音信号估计出环境传递函数进而通过反卷积运算实现去混响，该类方法需要进行环境传递函数盲估计等操作，计算强度非常大。已有技术中，申请号200810040707.X、名为“基于维纳滤波的语音去混响的消减方法”的专利，提出一种基于维纳滤波来实现的去混响方法。该方法需进行两次反卷积运算，首先利用预存的“喂”、“Hi”等纯净语音，通过维纳滤波反卷积运算得到混响环境的冲击响应，然后利用得到的混响环境冲击响应估计逆滤波器，对混响语音进行反卷积运算获得去混响的语音信号。该方法无需提前预知混响环境的冲击响应，且计算强度远低于盲反卷积方法。但是由于该方法利用维纳滤波反卷积计算混响环境冲击响应时，需依赖预存的纯净音，使得其应用场景受到很大的限制。申请号201310398174.3、名为“一种音频混响的抑制装置及其抑制方法”的专利，提出一种基于谱减思想的去混响方法。该方法需要先对混响时间进行估算，然后利用混响时间建立混响统计模...

【技术保护点】
一种语音数据的去混响方法，旨在频域对混响语音进行谱减操作以消除混响干扰，其特征在于，主要包括以下步骤：步骤a：对当前语音帧数据进行快速傅里叶变换后，将得到的频谱系数进行复功率计算，其中；步骤b：利用所述复功率谱计算谱减增益函数，在频域中利用所述谱减增益函数对混响成分进行抑制；步骤c：快速傅里叶逆变换，得到时域的去除混响的加窗语音帧数据，并进行幅值补偿处理；步骤d：语音帧输出处理。

【技术特征摘要】
1.一种语音数据的去混响方法，旨在频域对混响语音进行谱减操作以消除混响干扰，其特征在于，主要包括以下步骤：步骤a：对当前语音帧数据进行快速傅里叶变换后，将得到的频谱系数进行复功率计算，其中；步骤b：利用所述复功率谱计算谱减增益函数，在频域中利用所述谱减增益函数对混响成分进行抑制；步骤c：快速傅里叶逆变换，得到时域的去除混响的加窗语音帧数据，并进行幅值补偿处理；步骤d：语音帧输出处理。2.根据权利要求1所述的去混响方法，其特征在于，所述步骤b之前还包括以下操作：将所述复功率谱与所述当前帧的距离在设置的时长范围内某一帧的复功率谱进行平滑处理，得到当前帧复功率谱。3.根据权利要求2所述的去混响方法，其特征在于，所述当前帧的谱减增益函数计算公式为：，其中，为到当前帧的距离在设置的时长范围内其中一帧的复功率谱，为谱减增益计算系数。4.根据权利要求3所述的去混响方法，其特征在于，所述谱减增益计算系数可通过以下公式进行计算：，其中，取值范围为[0.02,0.1]，，取值范围为[0,2.5]。5.根据权利要求4所述的去混响方法，其特征在于，所述选为0.06，选为1.25，进而计算得为0.5152，选取所述当前帧的前面第二帧的复功率谱。6.根据权利要求5所述的去混响方法，其特征在于，对所述谱减增益函数进行平滑处理，得到均值谱减增益函数。7.根据权利要求6所述的去混响方法，其特征在于，利用所述均值谱减增益函数对混响成分进行谱减处理：,为去除混响成分...

【专利技术属性】
技术研发人员：韩翀蛟，高可攀，羊开云，徐晓峰，李夏宾，
申请(专利权)人：深圳市潮流网络技术有限公司，潮流网络有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人