语音分离方法和装置制造方法及图纸

技术编号：12399187 阅读：88 留言：0更新日期：2015-11-26 04:31

本发明专利技术实施例提供一种语音分离方法和装置，本实施例语音分离方法，包括：通过获得第一信号，根据第一信号确定初始理想二值掩蔽矩阵，根据初始理想二值掩蔽矩阵，对第一信号进行谐波补偿，得到谐波补偿后的分离语音信号，根据谐波补偿后的分离语音信号，对第一信号和第二信号进行滤波，得到目标分离语音信号，从而减少目标分离语音信号中能量空洞的产生，抑制了目标分离语音信号的扭曲。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及信号处理
，尤其涉及一种语音分离方法和装置。
技术介绍
语音信号处理作为一个近年来引人注目的研究领域，至今已经在大词汇量连续语音识别、语音合成、语音通信等方面取得了一系列令人瞩目的成果。然而，现有的语音信号处理技术不少都是在纯净语音或带弱噪声的语音环境下研发的，在比较嘈杂的环境中并不总是能获得令人满意的效果，这在一定程度上限制了部分语音相关产品在实际生活中的应用。因此，如何抑制或者消除背景噪音，从而分离出目标语音信号已经成为语音信号处理领域中一个重要的研究方向。计算听觉场景分析主要是基于听觉生理学和心理学领域的研究，采用声学掩蔽策略进行语音分离，使得分离语音更符合人耳的感知特性。现有技术中，通常采用基于阈值的理想二值掩蔽（Ideal Binary Mask,简称IBM)矩阵进行计算听觉场景分析，IBM矩阵是一个维度与时频谱图相同的0-1矩阵，其中1对应语音主导时频单元，〇对应噪音主导时频单元。在目标语音合成阶段，语音主导的时频单元能量全部被保留，噪音主导时频单元能量会全部被拒绝。然而由于基于阈值的IBM矩阵的错误估计会造成部分语音主导的时频单元被错误地拒绝，部分噪声主导的时频单元被错误地保留，从而导致在分离后的语音信号中产生许多语音能量的空洞，从而在很大程度上扭曲了原语音信号。
技术实现思路
本专利技术实施例提供一种语音分离方法和装置，采用计算听觉场景分析和理想浮值掩蔽策略获得分离语音信号，从而减少分离语音信号中能量空洞的产生，抑制了分离语音信号的扭曲。第一方面，本专利技术实施例提供...

【技术保护点】
一种语音分离方法，其特征在于，包括：获得第一信号，所述第一信号包括语音信号和噪音信号；根据所述第一信号确定初始理想二值掩蔽矩阵，所述初始理想二值掩蔽矩阵用于区分所述第一信号包括的语音信号和噪音信号；根据所述初始理想二值掩蔽矩阵，对所述第一信号进行谐波补偿，得到谐波补偿后的分离语音信号；根据所述谐波补偿后的分离语音信号，对所述第一信号和第二信号进行滤波，得到目标分离语音信号。

【技术特征摘要】

【专利技术属性】
技术研发人员：杨小洪，肖玮，梁山，刘文举，
申请(专利权)人：华为技术有限公司，中国科学院自动化研究所，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人