当前位置: 首页 > 专利查询>清华大学专利>正文

一种基于模拟信号处理架构的麦克风阵列声源定向系统技术方案

技术编号:22531019 阅读:52 留言:0更新日期:2019-11-13 08:31
本发明专利技术提供一种基于模拟信号处理架构的麦克风阵列声源定向系统,依次将麦克风阵列、模拟域声源定向处理模块和声源定向模块依次相连;基于互相关窗函数的广义互相关算法,采用模拟域声源定向处理模块对麦克风阵列中的多个麦克风采集的多个模拟语音信号进行处理,先根据多个模拟语音信号中的每任意两个模拟语音信号判断出一个声源定向区域,从而获得声源方向可能来源的多个声源定向区域,最后通过声源定向模块从多个声源定向区域中判断出最终的声源方向。本发明专利技术无需采用ADC而大大降低了系统功耗,同时也不需要FFT或IFFT的处理步骤而大大降低了系统延迟,并且采用的模拟电路较为简单,降低了模拟电路的复杂度,具有较好的系统扩展性。

A microphone array sound source orientation system based on analog signal processing architecture

The invention provides a microphone array sound source orientation system based on the analog signal processing architecture, which successively connects the microphone array, the analog domain sound source orientation processing module and the sound source orientation module; based on the generalized cross-correlation algorithm of the cross-correlation window function, the analog domain sound source orientation processing module is used to collect multiple analog voice signals from multiple microphones in the microphone array Firstly, a sound source orientation region is determined according to every two analog speech signals in multiple analog speech signals, so as to obtain multiple sound source orientation regions with possible source direction. Finally, the final sound source direction is determined from multiple sound source orientation regions by the sound source orientation module. The invention greatly reduces the power consumption of the system without adopting ADC, at the same time, it does not need the processing steps of FFT or IFFT to greatly reduce the system delay, and the analog circuit adopted is relatively simple, reduces the complexity of the analog circuit, and has better system expansibility.

【技术实现步骤摘要】
一种基于模拟信号处理架构的麦克风阵列声源定向系统
本专利技术涉及声源定向
,尤其涉及一种基于模拟信号处理架构的麦克风阵列声源定向系统。
技术介绍
近年来,声源定向方法作为一种基本的语音信号处理技术,吸引了众多研究者的注意,广泛应用于灾难现场救灾等领域。目前的研究主要关注于提高声源定位的分辨率,而在一些能源受限而又需要长时间工作的场景无法实际应用,比如在地震救灾场景中利用物联网进行常时声源定向时,在主机上收集信息然后定点救援,可以方便、安全、快速地救援被困人员,但是在这种场景下要求声源定向系统能够长时间工作,且对于系统尺寸的要求也有明显的限制。图1为传统的声源定向系统的结构示意图,如图1所示,传统的声源定向系统是在数字领域进行语音信号处理的,这意味着麦克风接收到的模拟语音信号需要先经过ADC处理为数字信号才能进行进一步地处理,而且由于算法的限制,需要采样率至少为16KHz的语音信号,才能准确定定向声源信号,声学信号处理领域即使采用低功耗∑ΔADC也需要279uW的能耗。每一个麦克风之后都需要接一个ADC,因此即使对于最简单的双麦克风阵列,ADC所占功耗都达到558uW。采用广义互相关(GCC)算法仿真一次声源定位需要的时间为2.66ms,因此双麦克风阵列后的两个ADC就需要消耗1.4896uJ的能量,优化后的一次浮点操作大约需要消耗25pJ,根据上述数据计算一次声源定位的计算能量为0.768uJ,由此可知ADC消耗整个系统65.98%的能耗。同时,传统的声源定向系统对于ADC处理后获得的数字信号还需要进行FFT和IFFT处理,仿真声源定位的过程中,不考虑ADC的延时,FFT和IFFT的延时占了系统延时的97.65%。因此,传统的声源定向系统由于需要对麦克风阵列采集的模拟信号采用ADC处理,因此会占用系统较大的能耗;同时,还由于需要对ADC处理后的数字信号进行FFT和IFFT处理,因此会使得系统的延时较大。
技术实现思路
为了解决传统的声源定向系统存在由于需要对麦克风阵列采集的模拟信号采用ADC处理,因此会占用系统较大的能耗,同时还由于需要对ADC处理后的数字信号进行FFT和IFFT处理,因此会使得系统的延时较大的问题,因此本专利技术实施例提供一种基于模拟信号处理架构的麦克风阵列声源定向系统,该系统包括:依次相连的麦克风阵列、模拟域声源定向处理模块和声源定向模块;其中,麦克风阵列用于采集多个模拟语音信号;模拟域声源定向处理模块用于获取多个模拟语音信号中每任意两个模拟语音信号的声源定向区域;声源定向模块用于根据多个声源定向区域获取声源方向。优选地,模拟域声源定向处理模块包括依次相连的延时器单元、乘法器单元、积分器单元和最大值选取单元;其中,延时器单元包括多对延时器;每对延时器的一端分别与麦克风阵列中采集每任意两个模拟信号之一的麦克风相连,另一端依次与乘法器单元、积分器单元和最大值选取单元相连,最大值选取单元与声源定向模块相连。优选地,模拟域声源定向处理模块用于获取多个模拟语音信号中每任意两个模拟语音信号的声源定向区域,具体包括:利用延时器单元将每任意两个模拟语音信号进行数字采样并将每任意两个模拟语音信号之一进行延时,以获取第一采样信号和第二采样信号;依次利用乘法器单元和积分器单元将第一采样信号和第二采样信号进行乘法计算和积分计算,以获取每任意两个模拟语音信号的基于互相关窗函数的广义互相关函数;利用最大值选取单元获取多个基于互相关窗函数的广义互相关函数中最大的一个对应的可选声源定向区域,以获取每任意两个模拟语音信号的声源定向区域;其中,可选声源定向区域为以发出每任意两个模拟语音信号的两个麦克风相连的直线为横轴,以横轴上两个麦克风之间的中点为原点,以延时器的对数为横轴一侧或另一侧的180°区域的划分数量,将180度区域逆时针划分所得的区域。优选地,获取每任意两个模拟语音信号的基于互相关窗函数的广义互相关函数之前,还包括:获取每任意两个模拟语音信号的初始广义互相关函数;利用互相关窗函数对初始广义互相关函数进行提取,获取基于互相关窗函数的广义互相关函数。优选地,基于互相关窗函数的广义互相关函数为:其中,R(τ)为基于互相关窗函数的广义互相关函数,x1[n]为第一采样信号,x2[n-τ]为第二采样信号,τ为延时器预设的延时,n为采样点序号,N为采样点个数。优选地,声源定向模块用于根据多个声源定向区域获取声源方向,具体包括:利用声源定向模块从多个声源定向区域中,选取重合次数最多的声源定向区域,并根据重合次数最多的声源定向区域确定声源方向;其中,重合次数是指判定为该声源定向区域的次数。优选地,从多个声源定向区域中,选取重合次数最多的声源定向区域,并根据重合次数最多的声源定向区域确定声源方向,具体包括:其中,f(x)为声源方向,x为声源方向所属的声源定向区域,r1、r2……rm为声源定向区域;|x-rm|表示声源方向x所属的声源定向区域与声源定向区域rm是否重合,若重合则为0,若不重合则为1。优选地,延时器包括第一开关、第二开关、第三开关、第四开关、第一电容、第二电容和第一差分放大器;其中,第一开关、第一电容、第二开关依次与第一差分放大器的正向输入端相连,第一差分放大器的负向输入端接地;第二开关的一端分别与第一开关和第一电容器相连,另一端接地;第三开关的一端分别与第一电容器和第二开关相连,另一端接地;第二电容器的一端与第一差分放大器的正向输入端相连,另一端与第一差分放大器的输出端相连,第四开关与第二电容器并联;其中,延时器预设的延时通过调节第三开关断开与第二开关闭合之间的时间差而控制;第三开关的关断时刻比第一开关的关断时刻早1us。优选地,乘法器单元的乘法器包括互相连接的第二差分放大器和第一尾电流源;其中,第二差分放大器的输出电压通过第一尾电流源控制。优选地,最大值选取单元包括互相连接的第三差分放大器和第二尾电流源,第三差分放大器的输出电压等于多个输入电压中的最大值;其中,输入电压为基于互相关窗函数的广义互相关函数的值。本专利技术实施例提供一种基于模拟信号处理架构的麦克风阵列声源定向系统,依次将麦克风阵列、模拟域声源定向处理模块和声源定向模块依次相连,通过麦克风阵列中的多个麦克风获取多个模拟语音信号,然后通过模拟域声源定向处理模块确定多个模拟语音信号中每任意两个模拟语音信号的声源定向区域,最后通过声源定向模块从多个声源定向区域中选出最终的声源方向。本专利技术实施例采用模拟域声源定向处理模块对多个模拟语音信号进行处理,先根据多个模拟语音信号中的任意两个模拟语音信号判断出一个声源定向区域,从而获得最终的声源方向可能来源的多个声源定向区域,最后从多个声源定向区域中判断出最终的声源方向。本专利技术实施例无需采用ADC,由此大大降低了系统功耗;同时也不需要FFT或IFFT的处理步骤,由此大大降低了系统延迟,并且采用的模拟电路较为简单,降低了模拟电路的复杂度,具有较好的系统扩展性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。本文档来自技高网
...

【技术保护点】
1.一种基于模拟信号处理架构的麦克风阵列声源定向系统,其特征在于,包括:依次相连的麦克风阵列、模拟域声源定向处理模块和声源定向模块;其中,所述麦克风阵列用于采集多个模拟语音信号;所述模拟域声源定向处理模块用于获取所述多个模拟语音信号中每任意两个模拟语音信号的声源定向区域;所述声源定向模块用于根据多个所述声源定向区域获取声源方向。

【技术特征摘要】
1.一种基于模拟信号处理架构的麦克风阵列声源定向系统,其特征在于,包括:依次相连的麦克风阵列、模拟域声源定向处理模块和声源定向模块;其中,所述麦克风阵列用于采集多个模拟语音信号;所述模拟域声源定向处理模块用于获取所述多个模拟语音信号中每任意两个模拟语音信号的声源定向区域;所述声源定向模块用于根据多个所述声源定向区域获取声源方向。2.根据权利要求1所述的基于模拟信号处理架构的麦克风阵列声源定向系统,其特征在于,所述模拟域声源定向处理模块包括依次相连的延时器单元、乘法器单元、积分器单元和最大值选取单元;其中,所述延时器单元包括多对延时器;每对所述延时器的一端分别与所述麦克风阵列中采集所述每任意两个模拟信号之一的麦克风相连,另一端依次与所述乘法器单元、所述积分器单元和所述最大值选取单元相连,所述最大值选取单元与所述声源定向模块相连。3.根据权利要求2所述的基于模拟信号处理架构的麦克风阵列声源定向系统,其特征在于,所述模拟域声源定向处理模块用于获取所述多个模拟语音信号中每任意两个模拟语音信号的声源定向区域,具体包括:利用所述延时器单元将所述每任意两个模拟语音信号进行数字采样并将所述每任意两个模拟语音信号之一进行延时,以获取第一采样信号和第二采样信号;依次利用所述乘法器单元和所述积分器单元将所述第一采样信号和所述第二采样信号进行乘法计算和积分计算,以获取所述每任意两个模拟语音信号的基于互相关窗函数的广义互相关函数;利用最大值选取单元获取多个所述基于互相关窗函数的广义互相关函数中最大的一个对应的可选声源定向区域,以获取所述每任意两个模拟语音信号的声源定向区域;其中,所述可选声源定向区域为以发出所述每任意两个模拟语音信号的两个麦克风相连的直线为横轴,以所述横轴上所述两个麦克风之间的中点为原点,以所述延时器的对数为所述横轴一侧或另一侧的180°区域的划分数量,将所述180度区域逆时针划分所得的区域。4.根据权利要求3所述的基于模拟信号处理架构的麦克风阵列声源定向系统,其特征在于,所述获取所述每任意两个模拟语音信号的基于互相关窗函数的广义互相关函数之前,还包括:获取所述每任意两个模拟语音信号的初始广义互相关函数;利用互相关窗函数对所述初始广义互相关函数进行提取,获取基于互相关窗函数的所述广义互相关函数。5.根据权利要求3所述的基于模拟信号处理架构的麦克风阵列声源定向系统,其特征在于,所述基于互相关窗函数的广义互相关函数为:其中,R(τ)...

【专利技术属性】
技术研发人员:乔飞刘长路李钦贾凯歌杨华中
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1