一种基于STFT的双通道语声分离方法技术

技术编号：16176815 阅读：77 留言：0更新日期：2017-09-09 04:09

本发明专利技术涉及一种基于STFT的双通道语声分离方法，包括以下步骤：S1，分别对左声道和右声道的时域信号序列进行STFT变换，得到左声道和右声道的频域信号序列；S2，获取左、右声道背景音乐分量之间的夹角条件，以及语声分量与频点信号之间的夹角条件，将语声和音乐分离；S3，对步骤S2得到的结果进行STFT反变换，得到语声和音乐分离后的左声道和右声道的时域信号。与现有技术相比，本发明专利技术利用STFT变换，可以将背景音乐和语声有效分离；考虑拾音系统的角度范围和拾音系统两通道之间的距离，确定了不同的相差条件，从而使计算结果更加准确；对得到的最后结果进行滤波，滤除不必要的噪声，可应用于K歌类型的手机应用程序中。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于STFT的双通道语声分离方法
本专利技术涉及一种语音处理方法，尤其是涉及一种基于STFT的双通道语声分离方法。
技术介绍
人声分离的主要技术来自于对频率和相位的处理，现有的技术基本都是两个手法联动作业，比如先进行频率阶段的滤波，在某些频率上再使用相位抵消。DFT算法可以有效的将时域信息转换为频域信息，DFT反变换则可以将频域信息转换为时域信息。DFT算法在数字滤波、功率谱分析、通讯理论中有广泛的应用。将此技术应用于人声与背景音乐的分离上，并加以改进，可以很好的分离人声。单通道音乐人声分离中的多种特定乐器强化分离方法涉及一种单通道音乐人声分离中的多种特定乐器强化分离方法。该方法对电吉他、单簧管、小提琴、钢琴、木吉他、风琴、长笛和小号共计8种乐器进行强化分离，该强化分离是通过一层单乐器分离器和三层多乐器组合强化器实现，其中，第一层多乐器组合强化器能够分离2类乐器声，第二层多乐器组合强化器能够分离4类乐器声，第三层多乐器组合强化器能够分离8类乐器声。然而该技术局限于对乐器声音的分离，应用领域较为狭窄；仅仅可以处理单通道音乐，单声道中所具有的信息太少，从而只能根据...
一种基于STFT的双通道语声分离方法

【技术保护点】
一种基于STFT的双通道语声分离方法，用于将语声和背景音乐分离，其特征在于，包括以下步骤：S1，分别对左声道和右声道的时域信号序列进行STFT变换，得到左声道和右声道的频域信号序列，各频点的信号分离表达式如下：

【专利技术属性】
技术研发人员：叶晨，陈建清，严诣青，干子轩，
申请(专利权)人：同济大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人