信号分离方法、装置、设备及存储介质制造方法及图纸

技术编号:21226485 阅读:17 留言:0更新日期:2019-05-29 07:16
本发明专利技术实施例公开了一种信号分离方法、装置、设备及存储介质。其中,该方法应用于多声源场景中,该方法包括:依据波束成形算法中的角度信息,对环形麦克风阵列所围成的圆周进行均匀分割操作,得到各波束音区;采用语音采集系统采集混合原始声源信号,其中,所述语音采集系统由所述环形麦克风阵列构成;对所述混合原始声源信号进行初步分离,确定各波束音区输出的初步声源信号;根据回声消除原理,对各初步声源信号进行消除处理,得到各初步声源信号对应的目标声源信号。本发明专利技术实施例提供的技术方案,能够准确地分离出各目标声源信号,且可适用于多声源场景中,为多声源场景中准确分离各个声源提供了一种新思路。

Signal Separation Method, Device, Equipment and Storage Media

The embodiment of the present invention discloses a signal separation method, device, device and storage medium. Among them, the method is applied to multi-source scenarios. The method includes: dividing the circumference of the ring microphone array evenly according to the angle information in the beamforming algorithm, and obtaining the sound areas of each beam; acquiring mixed original sound source signals by voice acquisition system, in which the voice acquisition system is composed of the ring microphone array; The original sound source signals are separated preliminarily to determine the initial sound source signals output from each beam sound area. According to the principle of echo cancellation, the initial sound source signals are eliminated and the target sound source signals corresponding to each initial sound source signal are obtained. The technical scheme provided by the embodiment of the present invention can accurately separate each target sound source signal, and can be applied in multi-source scene, providing a new idea for accurately separating each sound source in multi-source scene.

【技术实现步骤摘要】
信号分离方法、装置、设备及存储介质
本专利技术实施例涉及语音信号处理
,尤其涉及一种信号分离方法、装置、设备及存储介质。
技术介绍
随着语音识别应用的发展,越来越需要在复杂的声学环境下(例如多个说话人,多个干扰源等)进行单一发声源信号分离的能力。只有做到多声源分离,才能让语音识别系统在分离出来的单一发声源上正常工作。目前,盲信号处理在生物医学信号处理、通讯、图像和语音信号处理等多领域极具有应用价值。盲源分离(BSS,BlindSourceSeparation),又称为盲信号分离,是指在信号的理论模型和声源信号无法精确获知的情况下,如何从各个原始声源信号组成的混迭信号中分离出各声源信号的过程。但是,在一些特定的场景下,比如在多人处于一个较小的空间中,利用现有分离算法无法准确地分离出各目标声源信号。
技术实现思路
本专利技术实施例提供了一种信号分离方法、装置、设备和存储介质,在多声源场景中,能够准确地分离出各目标声源信号。第一方面,本专利技术实施例提供了一种信号分离方法,应用于多声源场景中,该方法包括:依据波束成形算法中的角度信息,对环形麦克风阵列所围成的圆周进行均匀分割操作,得到各波束音区;采用语音采集系统采集混合原始声源信号,其中,所述语音采集系统由所述环形麦克风阵列构成;对混合原始声源信号进行初步分离,确定各波束音区输出的初步声源信号;根据回声消除原理,对各初步声源信号进行消除处理,得到各初步声源信号对应的目标声源信号。第二方面,本专利技术实施例还提供了一种信号分离装置,该装置包括:音区确定模块,用于依据波束成形算法中的角度信息,对环形麦克风阵列所围成的圆周进行均匀分割操作,得到各波束音区;采集模块,用于采用语音采集系统采集混合原始声源信号,其中,所述语音采集系统由所述环形麦克风阵列构成;初步信号确定模块,用于对所述混合原始声源信号进行初步分离,确定各波束音区输出的初步声源信号;目标信号确定模块,用于根据回声消除原理,对各初步声源信号进行消除处理,得到各初步声源信号对应的目标声源信号。第三方面,本专利技术实施例还提供了一种设备,该设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中任意所述的信号分离方法。第四方面,本专利技术实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意所述的信号分离方法。本专利技术实施例提供的技术方案,通过在由环形麦克风阵列构成的语音采集系统中采用波束成形算法,可以将圆周分割为多个波束音区,进而可以将语音采集系统采集的混合原始声源信号分离为各波束音区对应的初步声源信号;在各波束音区对应的初步声源信号之后,可以根据回声消除原理,对各初步声源信号进行消除处理,可以消除各初步声源信号中相互干扰的成分,进而使每个波束音区只保留单一声源,即准确得到各初步声源信号对应的目标声源信号。本方案,相比于现有的技术方案,能够准确地分离出各目标声源信号,且可适用于多声源场景中,为多声源场景中准确分离各个声源提供了一种新思路。附图说明图1A是本专利技术实施例一中提供的一种信号分离方法的流程图;图1B是本专利技术实施例一中提供的一种波束音区示意图;图2是本专利技术实施例二中提供的一种信号分离方法的流程图;图3是本专利技术实施例三中提供的一种信号分离方法的流程图;图4是本专利技术实施例四中提供的一种信号分离方法的流程图;图5是本专利技术实施例五中提供的一种信号分离装置的结构框图;图6是本专利技术实施例六中提供的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术实施例,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术实施例相关的部分而非全部结构。实施例一图1A为本专利技术实施例一提供的一种信号分离方法的流程图,本实施可适用于如何从多个声源中准确地分离出各个声源,尤其适用于多声源场景中如会议室或车辆环境下等,多个人同时说话,或者说话人与多噪声源并存等的情况。该方法可以由本专利技术实施例提供的信号分离装置来执行,该装置可采用软件和/或硬件的方式实现,该装置可集成于计算设备中,也可独立作为一个设备。参见图1A,该方法具体包括:S110,依据波束成形算法中的角度信息,对环形麦克风阵列所围成的圆周进行均匀分割操作,得到各波束音区。本实施例中,环形麦克风阵列可构成语音采集系统,且可检测360度范围内多个声源。可选的,环形麦克风阵列中,每个麦克风均布置于圆周上,且每两个麦克风之间的间距相等。需要说明的是,为了提高波束成形算法分离声源信号的精度,以降低后续消除操作的复杂度,在实际应用场景中,可采用等于或大于4的偶数个麦克风构建环形麦克风阵列,例如可以采用6个麦克风构建环形麦克风阵列。波束成形算法是一种信号降维或获取特定范围信号的方法,也是一种分离信号的方法。例如,对于两个麦克风所形成的角度,通过波束成形算法可以一定程度上过滤该角度范围之外的声源信号,提取该角度范围内的声源信号,进而实现分离。本实施例中,为了实现对语音采集系统采集的混合原始声源信号的初分离,首先需执行S110的操作,即通过在由环形麦克风阵列构成的语音采集系统中采用波束成形算法,将环形麦克风阵列所围成的圆周分割为多个波束音区。角度信息是指波束成形算法中对声源信号进行分离的关键因素,可根据实际情况进行调整。例如,对于会议室场景中,可根据实际会议室中参会人数情况,设定波束成形算法中的角度信息。波束音区的角度大小及个数可由波束成形算法中的角度信息决定。例如,若波束成形算法中的角度信息为45度,则环形麦克风阵列所围成的圆周可均匀分割为8个角度为45度的波束音区。可选的,每个波束音区的角度范围由预先设定的0度和90度的参考方位确定。可选的,一定环境场景下,人数越多,设定波束成形算法的角度越小,所划分的波束音区越密,进而分离声源信号的精度越高。例如,如图1B所示,环形麦克风阵列由6个麦克风所构成。若波束成形算法中的角度信息为45度,则可以将6个麦克风所围成的圆周(360度)均匀分割为8个波束音区。为了保证能够准确地分离出各目标声源信号,可选的,采用波束成形算法所划分的波束音区的个数大于或等于实际环境中声源的个数。例如,在会议场景中,波束音区的个数大于等于参会人员个数。S120,采用语音采集系统采集混合原始声源信号,其中,语音采集系统由环形麦克风阵列构成。本实施例中,混合原始声源信号是指在多声源场景中,语音采集系统所采集的多个(即两个或两个以上的)声源信号混合而成的信号。例如,在会议室场景下,语音采集系统所采集的混合原始声源信号可以是多个人说话所产生的声源信号混合而成;在车辆环境下,语音采集系统所采集的混合原始声源信号可以是车内人员说话所产生的声源信号和车外环境所产生的噪声源信号混合而成;在机械环境下,语音采集系统所采集的混合原始声源信号可以是工厂内不同机械运转所产生的多个噪声源信号混合而成等。S130,对混合原始声源信号进行初步分离,确定各波束音区输出的初步声源信号。本实施例中,初步声源信号是指对语音采集系统所采集的混合原始声源信号进行初步分离处理所得到的信号。具体的,本文档来自技高网...

【技术保护点】
1.一种信号分离方法,其特征在于,应用于多声源场景中,所述方法包括:依据波束成形算法中的角度信息,对环形麦克风阵列所围成的圆周进行均匀分割操作,得到各波束音区;采用语音采集系统采集混合原始声源信号,其中,所述语音采集系统由所述环形麦克风阵列构成;对所述混合原始声源信号进行初步分离,确定各波束音区输出的初步声源信号;根据回声消除原理,对各初步声源信号进行消除处理,得到各初步声源信号对应的目标声源信号。

【技术特征摘要】
1.一种信号分离方法,其特征在于,应用于多声源场景中,所述方法包括:依据波束成形算法中的角度信息,对环形麦克风阵列所围成的圆周进行均匀分割操作,得到各波束音区;采用语音采集系统采集混合原始声源信号,其中,所述语音采集系统由所述环形麦克风阵列构成;对所述混合原始声源信号进行初步分离,确定各波束音区输出的初步声源信号;根据回声消除原理,对各初步声源信号进行消除处理,得到各初步声源信号对应的目标声源信号。2.根据权利要求1所述的方法,其特征在于,根据回声消除原理,对各初步声源信号进行消除处理,得到各初步声源信号对应的目标声源信号,包括:针对每一初步声源信号,从剩余初步声源信号中选取参考信号;根据回声消除原理,对参考信号和该初步声源信号进行消除处理,确定该初步声源信号对应的目标声源信号。3.根据权利要求2所述的方法,其特征在于,从剩余初步声源信号中选取参考信号,包括:将输出该初步声源信号的波束音区作为目标波束音区;去除与所述目标波束音区相邻的波束音区输出的初步声源信号,将更新后剩余初步声源信号作为参考信号。4.根据权利要求2所述的方法,其特征在于,从剩余初步声源信号中选取参考信号,包括:将输出该初步声源信号的波束音区作为旋转起始区,以预设方向在圆周上旋转,将每间隔预设弧长的波束音区作为候选音区;将所述候选音区输出的初步声源信号作为参考信号。5.根据权利要求1所述的方法,其特征在于,根据回声消除原理,对各初步声源信号进行消除处理,得到各初步声源信号对应的目标声源信号之后,还包括:采用声源定位算法,确定各声源的角度;依据各声源的角度,以及各波束音区的角...

【专利技术属性】
技术研发人员:徐燃刘东强
申请(专利权)人:北京儒博科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1