【技术实现步骤摘要】
一种基于STFT的双通道语声分离方法
本专利技术涉及一种语音处理方法,尤其是涉及一种基于STFT的双通道语声分离方法。
技术介绍
人声分离的主要技术来自于对频率和相位的处理,现有的技术基本都是两个手法联动作业,比如先进行频率阶段的滤波,在某些频率上再使用相位抵消。DFT算法可以有效的将时域信息转换为频域信息,DFT反变换则可以将频域信息转换为时域信息。DFT算法在数字滤波、功率谱分析、通讯理论中有广泛的应用。将此技术应用于人声与背景音乐的分离上,并加以改进,可以很好的分离人声。单通道音乐人声分离中的多种特定乐器强化分离方法涉及一种单通道音乐人声分离中的多种特定乐器强化分离方法。该方法对电吉他、单簧管、小提琴、钢琴、木吉他、风琴、长笛和小号共计8种乐器进行强化分离,该强化分离是通过一层单乐器分离器和三层多乐器组合强化器实现,其中,第一层多乐器组合强化器能够分离2类乐器声,第二层多乐器组合强化器能够分离4类乐器声,第三层多乐器组合强化器能够分离8类乐器声。然而该技术局限于对乐器声音的分离,应用领域较为狭窄;仅仅可以处理单通道音乐,单声道中所具有的信息太少,从而只能根据 ...
【技术保护点】
一种基于STFT的双通道语声分离方法,用于将语声和背景音乐分离,其特征在于,包括以下步骤:S1,分别对左声道和右声道的时域信号序列进行STFT变换,得到左声道和右声道的频域信号序列,各频点的信号分离表达式如下:
【技术特征摘要】
1.一种基于STFT的双通道语声分离方法,用于将语声和背景音乐分离,其特征在于,包括以下步骤:S1,分别对左声道和右声道的时域信号序列进行STFT变换,得到左声道和右声道的频域信号序列,各频点的信号分离表达式如下:其中,|ωL|为左声道信号的模值,为左声道信号的单位向量,|ωhumanL|为左声道语声分量的模值,为左声道语声分量的单位向量,|ωmusicL|为左声道背景音乐分量的模值,为左声道语声分量的单位向量,|ωR|为右声道信号的模值,为右声道信号的单位向量,|ωhumanR|为右声道语声分量的模值,为右声道语声分量的单位向量,|ωmusicR|为右声道背景音乐分量的模值,为右声道语声分量的单...
【专利技术属性】
技术研发人员:叶晨,陈建清,严诣青,干子轩,
申请(专利权)人:同济大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。