当前位置: 首页 > 专利查询>清华大学专利>正文

一种多音源定位方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28620125 阅读:15 留言:0更新日期:2021-05-28 16:15
本发明专利技术提供一种多音源定位方法、装置、电子设备及存储介质,该方法包括:对麦克风阵列获取的多音源信号进行分析,得到多个麦克风与基准麦克风之间的相关峰信息;根据所述基准麦克风的序列号与所述多个麦克风的序号列的差值,筛选所述相关峰信息中的纯净峰信息和混合峰信息;根据所述纯净峰信息计算各个到达角,并根据所述混合峰信息识别每个达到角的音源,确定来自同一音源的到达角;根据来自同一音源的到达角进行音源定位。将相关峰信息划分为纯净峰和混合峰,然后根据纯净峰估计各个到达角,并根据混合峰适合每个到达角的音源,确定属于同一个音源的LOS的到达角和ECHO的到达角,最终实现在多音源情况的音源定位。

【技术实现步骤摘要】
一种多音源定位方法、装置、电子设备及存储介质
本专利技术涉及音源定位
,尤其涉及一种多音源定位方法、装置、电子设备及存储介质。
技术介绍
智能设备在我们的日常生活中越来越流行。声音识别是智能设备的一项重要功能。智能音箱支持各种吸引人的应用,如家电语音控制、人机对话、娱乐中心等。随着智能家居的快速发展,对智能设备上声源定位的需求越来越大。定位音源的能力,很大程度地提升智能设备的理解能力,包括但不限于以下几种情况:(1)定位能力使智能音箱能够处理用户位置敏感的语音命令:当用户躺在床上说“开灯”时,智能音箱如果能获知用户,即声源的位置后,就能推测用户大概率是想看书或者电视,从而智能地关闭顶灯,打开阅读灯。(2)定位能力能让智能音箱更好地感知真实的物理状态:当智能音箱听到窗户或门的异常声音是来自婴儿房间的时候,该设备就能提醒父母潜在的危险。常规声源定位的方法需要部署多个分布式麦克风阵列。基于对阵列中音源的飞行时间差(time-difference-of-flight,TDOA)或到达方角(direction-of-arrival,DoA)的估计,可以通过三边或者三角测量对音源进行定位。但是,这些多阵列的解决方案无法应用于智能音箱这类设备,因为该设备通常仅配备一个麦克风阵列。单个阵列定位声源的难点在于远场效应。普通商用的麦克风阵列的典型尺寸只有几厘米,该尺寸和音源与阵列之间的距离可以忽略不计。从而,声学信号到麦克风的传播射线被认为是彼此平行的。由于有限的空间分辨率(阵列大小或孔径)和时间分辨率,即麦克风的采样率,商用阵列无法分离近乎平行射线的DoA。同时,由于真实场景中有多个声源。例如,在家居环境中,可能会有其他家庭成员的谈话、电视、洗衣机、微波炉和环境噪音。这些信号源会干扰用户的语音命令,阻碍了智能设备定位,因此多音源干扰是定位音源的另一个难点。因此,如何同时定位多个音源,已经成为业界亟待解决的问题。
技术实现思路
本专利技术提供一种多音源定位方法、装置、电子设备及存储介质,用以解决现有技术中无法很好的同时实现多音源定位的问题。本专利技术提供一种多音源定位方法,包括:对麦克风阵列获取的多音源信号进行分析,得到多个麦克风与基准麦克风之间的相关峰信息;根据所述基准麦克风的序列号与所述多个麦克风的序号列的差值,筛选所述相关峰信息中的纯净峰信息和混合峰信息;根据所述纯净峰信息计算各个到达角,并根据所述混合峰信息识别每个达到角的音源,确定来自同一音源的到达角;根据来自同一音源的到达角进行音源定位。根据本专利技术的一种多音源定位方法,所述麦克风阵列获取的多音源信号包括:多个音源信号;其中,每个音源信号均包括视距路径LOS传播的音源信号和墙反射路径ECHO传播的音源信号。根据本专利技术的一种多音源定位方法,根据所述基准麦克风的序列号与所述多个麦克风的序号列的差值,筛选所述相关峰信息中的纯净峰信息和混合峰信的步骤,具体包括:根据多个麦克风与基准麦克风之间的相关峰信息,构建多个麦克风组的相关峰时移组合;其中,所述麦克风组是由所述基准麦克风和任一麦克风组成的;采用曲线拟合的方法,通过所述基准麦克风的序列号与所述多个麦克风的序号列的差值,结合相关峰时移组合中的相关峰时移,构建拟合指数模型;将拟合指数最小化相关峰组合作为纯净峰信息,将除所述纯净峰信息外的其它相关峰信息作为混合峰信息;其中,所述拟合指数最小化相关峰组合是指,所述拟合指数模型的拟合指数取最小值时,对应的相关峰组合。根据本专利技术的一种多音源定位方法,对麦克风阵列获取的多音源信号进行分析,得到多个麦克风与基准麦克风之间的相关峰信息的步骤之后,所述方法还包括:在所述麦克风阵列为一般阵列的情况下,根据所述基准麦克风的极坐标和所述麦克风的极坐标,计算每个麦克风组的相对延迟;根据每个麦克风组的相对延迟,构建拟合指数模型,将拟合指数最小化相关峰组合作为纯净峰信息,将除所述纯净峰信息外的其它相关峰信息作为混合峰信息;其中,所述拟合指数最小化相关峰组合是指所述拟合指数模型的拟合指数取最小值的相关峰组合。根据本专利技术的一种多音源定位方法,根据所述纯净峰信息计算各个到达角,并根据所述混合峰信息识别每个达到角的音源,确定来自同一音源的到达角的步骤,具体包括:分别对纯净峰信息中的任意两个纯净峰进行对齐和增强处理,再计算每个纯净峰的相关函数;对所述每个纯净峰的相关函数进行平移,得到两个平移后的相关函数;若所述两个平移后的相关函数存在满足预设条件的相关峰,则判断这两个纯净峰为同一个音源;其中,所述预设条件为,两个平移后的相关函数的相关峰位置与原点对称,且相关峰的峰值得到了增强。根据本专利技术的一种多音源定位方法,所述根据来自同一音源的到达角进行音源定位的步骤,具体包括:根据来自同一音源到达角正切值的绝对值,识别来自同一音源的LOS到达角和ECHO到达角;根据LOS的到达角和ECHO的到达角,结合麦克风阵列与附近墙壁的距离,构建LOS的直线表达式和ECHO的直线表达式;求解LOS的直线表达式和ECHO的直线表达式的交点,得到音源定位信息。根据本专利技术的一种多音源定位方法,所述LOS的直线表达式和ECHO直线表达式,具体为:其中,α是麦克风阵列相对于墙的方向,是需要系统部署的时候需要测量的量,d0为麦克风阵列与附近墙壁的距离,θ1为视距路径LOS的到达角,θ2为墙反射路径ECHO的到达角。本专利技术还提供一种多音源定位装置,包括:分析模块,用于对麦克风阵列获取的多音源信号进行分析,得到多个麦克风与基准麦克风之间的相关峰信息;筛选模块,用于根据所述基准麦克风的序列号与所述多个麦克风的序号列的差值,筛选所述相关峰信息中的纯净峰信息和混合峰信息;确认模块,用于根据所述纯净峰信息计算各个到达角,并根据所述混合峰信息识别每个达到角的音源,确定来自同一音源的到达角;定位模块,用于根据来自同一音源的到达角进行音源定位。本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述多音源定位方法的步骤。本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述多音源定位方法的步骤。本专利技术提供的一种多音源定位方法、装置、电子设备及存储介质,通过引入墙反射路径ECHO,即同一音源的信号分别通过视距路径LOS和墙反射路径ECHO达到麦克风,而ECHO的引入可以有效改善远场效应导致的单个阵列难以实现音源定位的问题,同时将多个麦克风与基准麦克风之间的相关峰信息划分为纯净峰和混合峰,然后根据纯净峰估计各个到达角,并根据混合峰适合每个到达角的音源,最终确定属于同一个音源的LOS的到达角和ECHO的到达角,最终实现在多音源情况的音源定位本文档来自技高网
...

【技术保护点】
1.一种多音源定位方法,其特征在于,包括:/n对麦克风阵列获取的多音源信号进行分析,得到多个麦克风与基准麦克风之间的相关峰信息;/n根据所述基准麦克风的序列号与所述多个麦克风的序号列的差值,筛选所述相关峰信息中的纯净峰信息和混合峰信息;/n根据所述纯净峰信息计算各个到达角,并根据所述混合峰信息识别每个达到角的音源,确定来自同一音源的到达角;/n根据来自同一音源的到达角进行音源定位。/n

【技术特征摘要】
1.一种多音源定位方法,其特征在于,包括:
对麦克风阵列获取的多音源信号进行分析,得到多个麦克风与基准麦克风之间的相关峰信息;
根据所述基准麦克风的序列号与所述多个麦克风的序号列的差值,筛选所述相关峰信息中的纯净峰信息和混合峰信息;
根据所述纯净峰信息计算各个到达角,并根据所述混合峰信息识别每个达到角的音源,确定来自同一音源的到达角;
根据来自同一音源的到达角进行音源定位。


2.根据权利要求1所述多音源定位方法,其特征在于,所述麦克风阵列获取的多音源信号包括:多个音源信号;
其中,每个音源信号均包括视距路径LOS传播的音源信号和墙反射路径ECHO传播的音源信号。


3.根据权利要求1所述多音源定位方法,其特征在于,根据所述基准麦克风的序列号与所述多个麦克风的序号列的差值,筛选所述相关峰信息中的纯净峰信息和混合峰信的步骤,具体包括:
根据多个麦克风与基准麦克风之间的相关峰信息,构建多个麦克风组的相关峰时移组合;
其中,所述麦克风组是由所述基准麦克风和任一麦克风组成的;
采用曲线拟合的方法,通过所述基准麦克风的序列号与所述多个麦克风的序号列的差值,结合相关峰时移组合中的相关峰时移,构建拟合指数模型;
将拟合指数最小化相关峰组合作为纯净峰信息,将除所述纯净峰信息外的其它相关峰信息作为混合峰信息;
其中,所述拟合指数最小化相关峰组合是指,所述拟合指数模型的拟合指数取最小值时,对应的相关峰组合。


4.根据权利要求1所述多音源定位方法,其特征在于,对麦克风阵列获取的多音源信号进行分析,得到多个麦克风与基准麦克风之间的相关峰信息的步骤之后,所述方法还包括:
在所述麦克风阵列为一般阵列的情况下,根据所述基准麦克风的极坐标和所述麦克风的极坐标,计算每个麦克风组的相对延迟;
根据每个麦克风组的相对延迟,构建拟合指数模型,将拟合指数最小化相关峰组合作为纯净峰信息,将除所述纯净峰信息外的其它相关峰信息作为混合峰信息;
其中,所述拟合指数最小化相关峰组合是指所述拟合指数模型的拟合指数取最小值的相关峰组合。


5.根据权利要求2所述多音源定位方法,其特征在于,根据所述纯净峰信息计算各个到达角,并根据所述混合峰信息识别每个达到角的音源,确...

【专利技术属性】
技术研发人员:何源王伟国李金明
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1