一种基于子带分解的在线声源分离增强系统技术方案

技术编号:24582851 阅读:25 留言:0更新日期:2020-06-21 01:22
本发明专利技术公开了一种基于子带分解的在线声源分离增强系统,具体包括子带分解模块、语音活动检测模块、特征提取模块、说话人识别模块、参数估计模块、声源分离模块、后置滤波模块和子带合成模块。该系统利用识别出的说话人单独发声的片段估计对应声源的相对传递函数RTF,实现了实时的相对传递函数RTF估计,同时降低了其他声源信号对某个特定声源相对传递函数RTF估计的干扰;同时该系统提高了传统KNN说话人识别的准确率,并且在噪声干扰较大时也能有较高的识别准确率。

An on-line sound source separation enhancement system based on subband decomposition

【技术实现步骤摘要】
一种基于子带分解的在线声源分离增强系统
本专利技术涉及语音信号处理
,尤其涉及一种基于子带分解的在线声源分离增强系统。
技术介绍
语音交流是人类生活中必不可少的一部分,语音表达的信息比文字更加直接。近年来,智能手机、智能音箱等可以进行人机交互的智能设备得到了广泛应用,这些设备可以识别人们发出的交互指令,方便了人们的生活。但是,当有多个人(一般为2~4个)同时讲话时,因为语音间的相互干扰,导致智能设备的语音识别率明显降低,因此,需要将多个声源同时发出的语音分离出来,智能设备才能对特定声源发出的语音进行识别。Markovich等在文献[1]中提出一种可以抑制多个语音干扰源的语音增强方法,该方法采用广义旁瓣消除(GSC)架构实现,如图1所示,分为三部分:固定波束形成器(FBF)、阻塞矩阵(BM)和自适应噪声消除器(ANC),FBF将信号延迟求和得到初步增强的单路信号,BM利用目标声源和干扰声源的声传递函数实现,能使干扰信号和噪声源通过,阻止目标声源信号通过,ANC采用自适应的方法进一步抑制干扰和噪声信号。但是文献[1]的缺陷是使用一个G本文档来自技高网...

【技术保护点】
1.一种基于子带分解的在线声源分离增强系统,其特征在于包括:/n子带分解模块,对麦克风接收到的信号进行分帧和缓存处理得到缓存信号,对缓存信号进行子带分解得到子带信号;/n语音活动检测模块,接收子带分解模块传送的子带信号,利用子带信号估计临界频带信噪比,对所有临界频带上信噪比求和得到当前帧信号的总信噪比,如果总信噪比大于信噪比阈值则判断当前帧的子带信号为语音并输出,否则,判断当前帧的子带信号为噪声并更新噪声的临界频带能量同时输出噪声子带信号;/n特征提取模块,接收语音活动检测模块输出的语音子带信号、提取该子带信号的梅尔倒谱系数,先提取训练时间段的子带信号的特征作为训练特征,在识别阶段提取待识别子...

【技术特征摘要】
1.一种基于子带分解的在线声源分离增强系统,其特征在于包括:
子带分解模块,对麦克风接收到的信号进行分帧和缓存处理得到缓存信号,对缓存信号进行子带分解得到子带信号;
语音活动检测模块,接收子带分解模块传送的子带信号,利用子带信号估计临界频带信噪比,对所有临界频带上信噪比求和得到当前帧信号的总信噪比,如果总信噪比大于信噪比阈值则判断当前帧的子带信号为语音并输出,否则,判断当前帧的子带信号为噪声并更新噪声的临界频带能量同时输出噪声子带信号;
特征提取模块,接收语音活动检测模块输出的语音子带信号、提取该子带信号的梅尔倒谱系数,先提取训练时间段的子带信号的特征作为训练特征,在识别阶段提取待识别子带信号的特征作为待识别特征;
说话人识别模块,在识别阶段利用K最近邻算法将待识别特征与训练特征比较得到语音子带信号的说话人标签;
参数估计模块,接收语音活动检测模块输出的语音子带信号、噪声子带信号以及说话人识别模块传送的说话人标签,估计噪声子带信号的噪声功率谱矩阵,在识别阶段读取说话人标签信息并根据语音子带信号估计出该说话人的相对传递函数;
声源分离模块,接收子带分解模块传送的子带信号、参数估计模块传送的相对传递函数矩阵和噪声功率谱矩阵,采用线性约束最小方差(LCMV)算法获取LCMV滤波系数矩阵,将LCMV滤波系数矩阵作用于输入子带信号得到分离后各个声源的子带信号;
后置滤波模块,接收声源分离模块传送的子带信号以及参数估计模块传送的相对传递函数矩阵和噪声功率谱矩阵,利用相对传递函数矩阵和噪声功率谱矩阵估计残留噪声功率谱矩阵和目标信号功率谱矩阵,采用多说话人维纳后置滤波(MWPF)算法获取后置滤波系数矩阵,将后置滤波系数矩阵作用于声源分离模块输出的子带信号得到最终的子带信号;
子带合成模块,接收后置滤波模块传送的子带信号、对该子带信号进行缓存处理得到子带缓存信号,对子带缓存信号进行子带合成得到各个声源的时域信号。


2.根据权利要求1所述的一种基于子带分解的在线声源分离增强系统,其特征还在于:所述子带分解模块对麦克风接收到的信号以一定的采样频率采样后得到yi(n),i=1,2,...,M,M是麦克风的数目,对该信号进行分帧、缓存得到yi'(l,n),缓存的长度为N,则子带分解后的信号为



其中,l表示帧号,k表示子带,D是子带数目的一半,在本发明中设为D=160,N=6×2D,h(n)为分析滤波器的系数



其中式(1)采用如下算法计算:






其中,式(4)采用快速傅里叶变换实现,在计算子带信号时,只需计算前面一半即可,后面一半根据共轭对称性直接得出,即





3.根据权利要求1所述的一种基于子带分解的在线声源分离增强系统,其特征还在于:所述说话人识别模块获取子带信号的说话人标签采用如下方式:如果...

【专利技术属性】
技术研发人员:王鹤陈喆殷福亮
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1