声源分离方法与装置制造方法及图纸

技术编号:16876301 阅读:27 留言:0更新日期:2017-12-23 13:36
本发明专利技术涉及声源分离方法与装置。一种声源分离方法,包含有将一分离矩阵施加于多个接收信号,以产生多个分离结果;对该多个分离结果进行一辨识运算,以产生多个辨识分数;根据该多个辨识分数,产生一限制条件;以及根据该限制条件,调整该分离矩阵;其中,调整后的该分离矩阵施加于该多个接收信号,以自该接收信号中分离出更新的多个分离结果。

Sound source separation method and device

The invention relates to a sound source separation method and device. A sound source separation method, including a separation matrix is applied to a plurality of receiving signals, to generate multiple separation results; a plurality of identification operations on the results of the separation, to produce a plurality of identification scores; according to the multiple identification scores, generates a constraint condition; and according to the constraint conditions. Adjust the separation matrix; among them, the separation matrix after adjustment is applied to the multiple received signals from the received signal, to separate multiple separation results update.

【技术实现步骤摘要】
声源分离方法与装置
本专利技术系指一种声源分离方法与装置,尤指一种随目标信号的空间变化而据以调整的声源分离方法与装置。
技术介绍
语音输入及语音识别已广泛地应用于手机等电子产品中,而多麦克风则常用于强化语音识别的效果。在具有多麦克风之语音识别系统中,可通过适应性波束形成器(AdaptiveBeamformer)技术进行空间滤波以强化指定方向信号,再对强化后的信号进行语音识别。适应性波束形成器需先对声源进行来向(Direction-of-Arrival,DoA)估测来获取或修正波束形成器的指向,然而,适应性波束形成器的缺点在于容易受到来向估测误差的影响而导致指定方向失真。另外,现有技术中已发展出利用具有限制条件的盲信号分离(Constrained-Blind-Source-Separation,CBSS)方法来产生分离矩阵,其可从多麦克风数组的接收信号中分离出多个声源,并可同时解决习知盲信号分离的分离声源排列(Permutation)的问题。然而,习知盲信号分离所需的限制条件无法针对目标信号的空间变化而据以调整,而使分离目标信号的效能降低。因此,现有技术实有改善的必要。
技术实现思路
本专利技术的主要目的在于提供一种随目标信号的空间变化而据以调整的声源分离方法与装置,以改善现有技术的缺点。本专利技术揭露一种声源分离方法,用来自多个接收信号中进行声源分离,该声源分离方法包含有将一分离矩阵施加于该多个接收信号,以产生多个分离结果;对该多个分离结果进行一辨识运算,以产生多个辨识分数,其中该多个辨识分数相关于该多个分离结果与一目标信号之间的匹配程度;根据该多个辨识分数,产生一限制条件,其中该限制条件为一空间限制或一屏蔽限制;以及根据该限制条件,调整该分离矩阵;其中,调整后的该分离矩阵施加于该多个接收信号,以自该接收信号中分离出更新的该多个分离结果。本专利技术另揭露一种声源分离装置,用来自多个接收信号中进行声源分离,该声源分离装置包含有一分离单元,用来将一分离矩阵施加于该多个接收信号,以产生多个分离结果;一辨识单元,用来对该多个分离结果进行一辨识运算,以产生多个辨识分数,其中该多个辨识分数相关于该多个分离结果与一目标信号之间的匹配程度;一限制产生器,用来根据该多个辨识分数,产生一限制条件,其中该限制条件为一空间限制或一屏蔽限制;以及一分离矩阵产生器,用来根据该限制条件,调整该分离矩阵;其中,调整后的该分离矩阵施加于该多个接收信号,以自该接收信号中分离出更新的该多个分离结果。附图说明图1为本专利技术实施例一声源分离装置的示意图。图2为本专利技术实施例一声源分离流程的示意图。图3为本专利技术实施例一限制产生器的示意图。图4为本专利技术实施例一更新控制器的示意图。图5为本专利技术实施例一空间限制产生流程的示意图。图6为本专利技术实施例一限制产生器的示意图。图7为本专利技术实施例一更新控制器的示意图。图8为本专利技术实施例一屏蔽限制产生流程的示意图。图9为本专利技术实施例一声源分离装置的示意图。图10为本专利技术实施例一辨识单元的示意图。具体实施方式请参考图1,图1为本专利技术实施例一声源分离装置1的示意图。声源分离装置1可为一特殊应用集成电路(Application-Specific-Integrated-Circuit,ASIC),用来自接收信号x1~xM中分离出声源z1~zM,其中目标信号s1~sN可为语音信号而存在于声源z1~zM之中。声源z1~zM的型态有诸多种可能,举例来说,声源z1~zM可为背景噪声、回音、干扰或是来自语者的语音等,目标信号s1~sN于本专利技术的实施例可为一目标语者的语音或是特定的语音内容,故于一具有声源z1~zM的环境当中,目标信号s1~sN并非总是存在。为了更容易理解本专利技术,以下说明将假设以单一目标信号sn为例。声源分离装置1可应用于语音识别或语者辨识,其包含接收器R1~RM、一分离单元10、一辨识单元12、一限制产生器14以及一分离矩阵(DemixingMatrix)产生器16。接收器R1~RM可为麦克风,其可将所接收的接收信号x1~xM输入至分离单元10,其中接收信号x1~xM可表示为一接收信号组x,即x=[x1,...,xM]T。分离单元10耦接于分离矩阵产生器16,分离单元10用来将接收信号组x乘以分离矩阵产生器16所产生的一分离矩阵W,以产生一分离结果组y,分离结果组y包含分离结果y1~yM,即y=[y1,...,yM]T=Wx,其中分离结果y1~yM系为自接收信号x1~xM中所分离出对应于声源z1~zM的分离结果。辨识单元12用来对分离结果y1~yM分别进行一辨识运算,以产生对应于目标信号sn相似度的辨识分数(RecognitionScores)q1~qM,并将辨识分数q1~qM输入至限制产生器14,其中辨识分数qm越高代表分离结果ym与目标信号sn之间的匹配程度(或相似程度)越高。限制产生器14可根据辨识分数q1~qM产生一限制条件CT,用来做为指向空间中一特定方向的一控制信号,并将限制条件CT输入至分离矩阵产生器16。分离矩阵产生器16即可根据限制条件CT产生新的分离矩阵W(即调整分离矩阵W),调整后的分离矩阵W即可施加于接收信号x1~xM,以分离出声源z1~zM。上述分离矩阵产生器16,依据一实施例,可通过具有限制条件的盲信号分离(Constrained-Blind-Source-Separation,CBSS)方法来产生该分离矩阵W。辨识单元12可包含一特征撷取器26、一参考模型训练器22及一匹配器(Matcher)24,如图10所示。特征撷取器20可根据分离结果y1~yM分别产生一组特征信号b1~bM,以语音识别的应用为例,特征撷取器20所撷取的特征可为梅尔倒频谱系数(Mel-Frequency-Cepstral-Coefficients,MFCC)。当一训练旗标FG指示辨识单元12处于一训练阶段时,特征撷取器20自撷取分离结果y1~yM相关于目标信号sn的特征,并输入至参考模型训练器22,以产生目标信号sn的参考模型;而当训练旗标FG指示辨识单元12处于一测试阶段时,匹配器24将自分离结果y1~yM撷取出的特征与参考模型进行比对,以产生对应的辨识分数q1~qM。换言之,参考模型训练器22可以预先训练出对应于目标信号sn的一参考模型,接着,匹配器24再将该参考模型与特征撷取器20输出的特征信号b1~bM分别进行比对,比较其相似程度,并输出辨识分数q1~qM。其余关于辨识单元12的操作细节为本领域具通常知识者所熟知,故不在此赘述。简而言之,因辨识分数q1~qM会随目标信号相对于接收器R1~RM的空间特性不断地改变,声源分离装置1可根据辨识单元12于不同时间所产生的辨识分数q1~qM,产生不同的限制条件CT以做为指向某空间方向的一控制信号,并根据更新后的限制条件CT调整分离矩阵W,以分离声源z1~zM,并获得更新的分离结果y1~yM。如此一来,声源分离装置1所产生的限制条件CT及分离矩阵W皆可针对目标信号的空间变化而据以调整,进而增进目标信号分离的效能。关于声源分离装置1的操作流程可归纳成为一声源分离流程20,如图2所示,声源分离流程20包含以下步骤:步骤200:将分离矩阵W施加于接收信号x1~xM,以产生分离结果y1~本文档来自技高网...
声源分离方法与装置

【技术保护点】
一种声源分离方法,用来自多个接收信号中进行声源分离,该声源分离方法包含有:将一分离矩阵施加于该多个接收信号,以产生多个分离结果;对该多个分离结果进行一辨识运算,以产生多个辨识分数,其中该多个辨识分数相关于该多个分离结果与一目标信号之间的匹配程度;根据该多个辨识分数,产生一限制条件,其中该限制条件为一空间限制或一屏蔽限制;以及根据该限制条件,调整该分离矩阵;其中,调整后的该分离矩阵施加于该多个接收信号,以自该接收信号中分离出更新的该多个分离结果。

【技术特征摘要】
1.一种声源分离方法,用来自多个接收信号中进行声源分离,该声源分离方法包含有:将一分离矩阵施加于该多个接收信号,以产生多个分离结果;对该多个分离结果进行一辨识运算,以产生多个辨识分数,其中该多个辨识分数相关于该多个分离结果与一目标信号之间的匹配程度;根据该多个辨识分数,产生一限制条件,其中该限制条件为一空间限制或一屏蔽限制;以及根据该限制条件,调整该分离矩阵;其中,调整后的该分离矩阵施加于该多个接收信号,以自该接收信号中分离出更新的该多个分离结果。2.根据权利要求1所述的声源分离方法,其中对该多个分离结果进行该辨识运算,以产生该多个辨识分数的步骤包含有:建立对应于该目标信号的一参考模型;撷取该分离结果的特征;以及将该多个分离结果的特征与该参考模型进行比对,以产生该多个辨识分数。3.根据权利要求1所述的声源分离方法,其中根据该多个辨识分数,产生该空间限制的步骤包含有:根据该多个辨识分数,产生多个第一权重值;根据该多个辨识分数,产生一更新速率;根据该分离矩阵及该多个第一权重值,产生一更新系数;以及根据该更新系数及该更新速率,产生该空间限制。4.根据权利要求3所述的声源分离方法,其中根据该多个辨识分数,产生该多个第一权重值的步骤包含有:对该多个辨识分数进行一映像运算,以取得多个映射值;以及对该多个映射值进行一正规化运算,以取得该多个第一权重值。5.根据权利要求4所述的声源分离方法,其中根据该多个辨识分数,产生该更新速率的步骤包含有:取得该更新速率为该多个映射值的一最大值。6.根据权利要求3所述的声源分离方法,其中根据该分离矩阵及该多个第一权重值,产生该更新系数的步骤包含有:对该分离矩阵进行一反矩阵运算,以产生多个估测指向向量;...

【专利技术属性】
技术研发人员:李明唐朱仲石
申请(专利权)人:瑞昱半导体股份有限公司
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1