声源定位设备、声源定位方法和程序技术

技术编号：33769333 阅读：39 留言：0更新日期：2022-06-12 14:21

一种声源定位设备(2)包括：声音信号向量生成部(21)，其基于从接收声源所生成的声音的多个麦克风(11)输出的多个电信号来生成声音信号向量；子空间识别部(22)，其识别与包括在声音信号向量中的信号分量相对应的信号子空间以及与包括在声音信号向量中的噪声分量相对应的噪声子空间；候选识别部(23)，其通过将延迟和阵列法应用于声音信号向量来识别用于指示声源的方向的多个候选的一个或多于一个候选向量；以及方向识别部(24)，其基于包括信号子空间和噪声子空间内积的平方和的优化目标函数，将使用基于一个或多于一个候选向量中的至少一个候选向量的初始解搜索出的声源方向向量所指示的方向识别为声源的方向。向向量所指示的方向识别为声源的方向。向向量所指示的方向识别为声源的方向。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】声源定位设备、声源定位方法和程序

[0001]本公开涉及声源定位设备、声源定位方法和用于识别声源位置的程序。

技术介绍

[0002]传统地，研究了用于识别声源方向的方法。专利文献1公开了用于通过估计各种参数以使表示声源方向的后验分布与变分函数之间的差异的基于变分推断(variational inference)方法的目标函数最小化来估计声源位置的方法。
[0003][现有技术文献][0004][专利文献][0005]专利文献1：日本专利第6623185号公报

技术实现思路

[0006][专利技术要解决的问题][0007]当像在传统方法中那样使用变分推断方法时，估计值和用于获得估计值的变量是随机变量，因此存在多个未知参数。由于需要大量的计算来估计多个变量，因此使用变分推断的传统方法不适用于会议中声源的实时定位。
[0008]本公开关注该点，并且本公开的目的是缩短定位声源所需的时间。
[0009]用于解决问题的方案
[0010]本公开的一方面提供了一种声源定位设备，包括：声音信号向...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种声源定位设备，包括：声音信号向量生成部，其基于从多个麦克风输出的多个电信号来生成声音信号向量，所述多个麦克风接收声源所生成的声音；子空间识别部，其识别与所述声音信号向量中所包括的信号分量相对应的信号子空间以及与所述声音信号向量中所包括的噪声分量相对应的噪声子空间；候选识别部，其通过将延迟和阵列法应用于所述声音信号向量来识别用于指示所述声源的方向的多个候选的一个或多于一个候选向量；以及方向识别部，其基于包括所述信号子空间和所述噪声子空间的内积的平方和的优化目标函数，将使用基于所述一个或多于一个候选向量中的至少一个候选向量的初始解搜索出的声源方向向量所指示的方向识别为所述声源的方向。2.根据权利要求1所述的声源定位设备，其中，所述候选识别部在通过将所述延迟和阵列法应用于所述声音信号向量所识别出的所述一个或多于一个候选向量中，识别出与对应于所述信号子空间的信号子空间向量的内积的平方和满足预定的可靠度条件的所述初始解。3.根据权利要求1或2所述的声源定位设备，其中，与所述子空间识别部识别所述信号子空间和所述噪声子空间的处理并行地，所述候选识别部进行识别所述一个或多于一个候选向量的处理。4.根据权利要求1或3所述的声源定位设备，其中，所述声音信号向量生成部通过对所述多个电信号进行傅立叶变换来生成所述声音信号向量，以及所述方向识别部针对所述傅立叶变换的各帧识别所述声源的方向。5.根据权利要求4所述的声源定位设备，其中，所述方向识别部基于平均方向向量来识别所述声源的方向，所述平均方向向量是通过对利用所述傅立叶变换所生成的与多个频率区间相对应的多个所述声源方向向量进行平均而得到的。6.根据权利要求5所述的声源定位设备，其中，所述候选识别部通过以所述一个或多于一个候选向量的计算能够在应用于所述多个电信号的所述傅立叶变换的一帧内完成的方式对所述频率区间进行间隔剔除，来识别所述一个或多于一个候选向量。7.根据权利要求4至6中任一项所述的声源定位设备，其中，所述方向识别部通过使用由下式表示的所述优化目标函数的随机梯度下降法来识别所述声源方向向量，[等式13]其中...

【专利技术属性】
技术研发人员：金丸真健，
申请(专利权)人：铁三角有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人