一种基于固定波束形成的滤波方法及装置制造方法及图纸

技术编号:19936726 阅读:25 留言:0更新日期:2018-12-29 05:27
本发明专利技术实施例提供一种基于固定波束形成的滤波方法及装置,所述方法包括:获得待处理的多通道语音信号,其中,所述多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;基于所述语音估计信号和所述干扰估计信号,计算后置滤波参数;基于所述后置滤波参数,对所述语音估计信号进行滤波处理,获得处理后的语音信号。如此,通过后置滤波参数对波束成形后的语音信号进行滤波,能够确保目标声源指向的语音信号不失真,并有效抑制其它干扰信号。

【技术实现步骤摘要】
一种基于固定波束形成的滤波方法及装置
本专利技术实施例涉及信号处理
,尤其涉及一种基于固定波束形成的滤波方法及装置。
技术介绍
随着智能家居、物联网的兴起,智能音箱、可穿戴设备、智能手机等电子设备的快速普及,用户对于电子设备的功能以及智能化的要求越来越高,为了使得人机交互更自然简捷,大多数电子设备都配置有智能语音交互功能。但是,当用户和电子设备距离较大时,在电子设备通过传感器阵列(如麦克风阵列)远距离拾音时,由于受到真实环境中包含着的背景噪声(如背景音乐)、其它人声、混响等多种干扰,会使得电子设备所采集的目标用户的语音信号质量较差,导致语音识别准确度较低。目前,在采集用户语音时通常会使用波束成形(Beamforming),波束成形是一种用于传感器阵列(如麦克风阵列)的信号处理技术,用于定向信号接收和对接收到的声音信号进行适当的信号处理。专利技术人在研究波束成形过程中发现,由于真实环境中往往存在时变的混响和波束形成算法中的旁瓣的存在,且受到传感器阵列几何形状以及智能终端计算条件约束,导致不能有效抑制非平稳的干扰信号。
技术实现思路
有鉴于此,本专利技术实施例提供一种基于固定波束形成的滤波方法及装置,主要目的在于确保目标声源指向的用户语音信号不失真,并对其它空间指向的干扰信号进行有效抑制。为达到上述目的,本专利技术实施例主要提供如下技术方案:第一方面,本专利技术实施例提供一种基于固定波束形成的滤波方法,所述方法包括:获得待处理的多通道语音信号,其中,所述多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;基于所述语音估计信号和所述干扰估计信号,计算后置滤波参数;基于所述后置滤波参数,对所述语音估计信号进行滤波处理,获得处理后的语音信号。第二方面,本专利技术实施例提供一种基于固定波束形成的滤波装置,所述装置包括:获得单元,用于获得待处理的多通道语音信号,其中,所述多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;波束成形单元,用于基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;计算单元,用于基于所述语音估计信号和所述干扰估计信号,计算后置滤波参数;滤波单元,用于基于所述后置滤波参数,对所述语音估计信号进行滤波处理,获得处理后的语音信号。第三方面,本专利技术实施例提供一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述基于固定波束形成的滤波方法的步骤。第四方面,本专利技术实施例提供一种电子设备,所述设备包括:至少一个处理器;以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述基于固定波束形成的滤波方法的步骤。本专利技术实施例提供的基于固定波束形成的滤波方法及装置,在获得了同时包含目标声源的语音信号和干扰声源的干扰信号的多通道语音信号后,会先基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号。接下来,在进行固定波束成形后,会根据所获得的语音估计信号和干扰估计信号来计算出后置滤波参数。最后,通过该后置滤波参数,对语音估计信号进行滤波处理,获得处理后的语音信号。这样,先通过固定波束成形对语音信号进行波束增强,能够增强目标声源指向的用户语音信号,抑制其它方向的干扰信号,再通过后置滤波参数对增强后的语音信号进行后置滤波,能够对单个波束形成之后增强的用户语音信号中大量残留的干扰信号进行有效抑制。从而,实现了有效抑制非目标声源方向的干扰信号。那么,在应用到远距离拾音时,能够确保目标声源指向的用户语音信号不失真,并对其它空间指向的干扰信号进行有效抑制。附图说明通过阅读下文优选实施方式的详细描述,各种其它的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本专利技术实施例一中的基于固定波束形成的滤波方法的流程示意图;图2A至图2B为本专利技术实施例一中的麦克风阵列的示意图;图3为本专利技术实施例二中的多通道语音信号模型的示意图;图4为本专利技术实施例二中的多固定波束的示意图;图5为本专利技术实施例三中的基于固定波束形成的滤波装置的结构示意图;图6为本专利技术实施例四中的电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。实施例一本专利技术实施例提供一种基于固定波束形成的滤波方法,在实际应用中,该基于固定波束形成的滤波方法可以应用于各种需要对语音信号进行滤波来获取干净的语音信号的场合中,例如,在语音识别领域中,为了提高语音识别准确度,需要对传感器阵列所采集的包含有干扰信号的语音信号进行识别前的预处理,来增强目标用户的语音信号,去除环境噪声、其它人声等干扰信号,获得干净的用户语音信号。具体来说,该基于固定波束形成的滤波方法的执行主体为基于固定波束形成的滤波装置,该基于固定波束形成的滤波装置可以内置或外接于一电子设备。在实际应用中,该电子设备可以以各种形式来实施。例如,本专利技术实施例中描述的电子设备可以包括诸如智能音箱、智能电视、智能机顶盒等智能家居设备、诸如智能手机、平板电脑、智能手表、智能手环等随身设备等。当然,还可以为其它类型的具有用户语音采集和处理功能的电子设备,如笔记本电脑等。这里,本专利技术实施例中对电子设备的具体实现形式不做具体限定。那么,图1为本专利技术实施例一中的基于固定波束形成的滤波方法的流程示意图,参见图1所示,该基于固定波束形成的滤波方法可以包括:S101:获得待处理的多通道语音信号;其中,多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号。这里,目标声源一般是指当前使用电子设备正在发出声音的用户,如正在说话的人;干扰声源可以是指电子设备所处的当前环境中正在发出声音的其它人,如正在唱歌的另一人,也可以是指电子设备所处的当前环境中其它用户使用的正在发出声音的电子设备,如正在播放音乐的音箱、手机等。这里,目标声源的数量为一个,干扰声源的数量为一个或者多个,如两个、三个等。当然,在实际应用中,所获得的多通道语音信号中除了包括目标声源的语音信号以及来自干扰声源的干扰信号外,还可能包括有其它类型的干扰信号,例如环境噪音、混响干扰等。在实际应用中,目标声源和干扰声源可以指向为平面波0°~180°的任意角度。具体来说,为了获得待处理的多通道语音信号,可以通过电子设备中设置的传感器阵列来采集多通道语音信号。在实际应用中,该传感器阵列是由一定数量的声学传感器(例如,麦克风)组成,用来对声场的空间特性进行采样。示例性地,假设该传感器阵列是由麦克风阵列(M本文档来自技高网...

【技术保护点】
1.一种基于固定波束形成的滤波方法,其特征在于,所述方法包括:获得待处理的多通道语音信号,其中,所述多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;基于所述语音估计信号和所述干扰估计信号,计算后置滤波参数;基于所述后置滤波参数,对所述语音估计信号进行滤波处理,获得处理后的语音信号。

【技术特征摘要】
1.一种基于固定波束形成的滤波方法,其特征在于,所述方法包括:获得待处理的多通道语音信号,其中,所述多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;基于所述语音估计信号和所述干扰估计信号,计算后置滤波参数;基于所述后置滤波参数,对所述语音估计信号进行滤波处理,获得处理后的语音信号。2.根据权利要求1所述的方法,其特征在于,所述基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号,包括:基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得至少两个波束信号;将所述至少两个波束信号中波束指向为所述目标声源的指向的波束信号,确定为所述语音估计信号;将所述至少两个波束信号中除所述语音估计信号外的其它波束信号,确定为所述干扰估计信号。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述语音估计信号和所述干扰估计信号,计算后置滤波参数,包括:基于所述语音估计信号和所述干扰估计信号,计算时频级别后置增益;基于所述时频级别后置增益,计算帧级别后置增益。4.根据权利要求3所述的方法,其特征在于,所述基于所述后置滤波参数,对所述语音估计信号进行滤波处理,获得处理后的语音信号,包括:计算所述帧级别后置增益、所述时频级别后置增益和所述语音估计信号的乘积,获得所述处理后的语音信号。5.根据权利要求3所述的方法,其特征在于,所述基于所述语音估计信号和所述干扰估计信号,计算时频级别后置增益,包括:基于预设的权重系数,计算所述干扰估计信号的加权和,获得干扰信号能量估计值;基于所述语音估计信号和所...

【专利技术属性】
技术研发人员:孙思宁黄美玉
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1