音频设备自动定位制造技术

技术编号:34380336 阅读:14 留言:0更新日期:2022-08-03 20:55
一种用于估计环境中的音频设备位置的方法可以涉及获得所述环境中的多个音频设备中的每个音频设备的到达方向(DOA)数据以及基于所述DOA数据确定多个三角形中的每一个的内角。每个三角形可以具有与音频设备位置相对应的顶点。所述方法可以涉及确定所述三角形中的每一个的每条边的边长,执行将所述多个三角形中的每一个对齐的前向对齐过程以产生前向对齐矩阵,以及执行将所述多个三角形中的每一个以反向顺序对齐的反向对齐过程以产生反向对齐矩阵。每个音频设备位置的最终估计可以至少部分地基于所述前向对齐矩阵的值和所述反向对齐矩阵的值。对齐矩阵的值。对齐矩阵的值。

【技术实现步骤摘要】
【国外来华专利技术】音频设备自动定位

技术介绍

[0001]相关申请的交叉引用
[0002]本申请要求于2019年12月18日提交的美国临时专利申请号62/949,998、2019年12月18日提交的欧洲专利申请号19217580.0和2020年3月19日提交的美国临时专利申请号62/992,068的优先权,所述专利申请均通过引用并入本文。


[0003]本公开涉及用于自动定位音频设备的系统和方法。
[0004]
技术介绍

[0005]音频设备,包括但不限于智能音频设备,已经被广泛部署并且正在成为许多家庭的共同特征。尽管用于定位音频设备的现有系统和方法提供了益处,但改进的系统和方法将仍是期望的。
[0006]符号和术语
[0007]在本文中使用表达“智能音频设备”来表示智能设备,所述智能设备是单一用途音频设备或虚拟助理(例如,连接的虚拟助理)。单一用途音频设备是包括或耦接到至少一个麦克风(并且在一些示例中还可以包括或耦接到至少一个扬声器)并且很大程度上或主要被设计为实现单一用途的设备(例如,智能扬声器、电视(TV)或移动电话)。尽管TV通常可以播放(并且被认为能够播放)来自节目素材的音频,但是在大多数情况下,现代TV运行某种操作系统,应用程序(包括看电视的应用程序)在所述操作系统上本地运行。类似地,移动电话中的音频输入和输出可以做很多事情,但这些都是由电话上运行的应用程序服务的。从这个意义上说,具有(多个)扬声器和(多个)麦克风的单一用途音频设备通常被配置为运行本地应用程序和/或服务来直接使用(多个)扬声器和(多个)麦克风。一些单一用途音频设备可以被配置为组合在一起以实现在区域或用户配置的区域上播放音频。
[0008]在本文中,“虚拟助理”(例如,连接的虚拟助理)是包括或耦接到至少一个麦克风(并且可选地还包括或耦接到至少一个扬声器)的设备(例如,智能扬声器、智能显示器或语音助理集成设备),并且所述设备可以提供将多个设备(不同于虚拟助理)用于在某种意义上启用云或者未在虚拟助理本身中或上实施的应用程序的能力。虚拟助理有时可以一起工作,例如,以非常离散和有条件定义的方式。例如,两个或更多个虚拟助理可以在其中一个(即最确信已经听到唤醒词的虚拟助理)响应于所述词的意义上一起工作。连接的设备可以形成一种系列,所述系列可以由一个主应用程序管理,所述主应用程序可以是(或包括或实施)虚拟助理。
[0009]在本文中,“唤醒词”在广义上用于表示任何声音(例如,人类说出的词或一些其他声音),其中智能音频设备被配置成响应于检测到(“听到”)声音(使用包括在智能音频设备中或耦接到所述智能音频设备的至少一个麦克风,或至少一个其他麦克风)而唤醒。在这种情况下,“唤醒”表示设备进入等待(即,正在收听)声音命令的状态。
[0010]在本文中,表达“唤醒词检测器”表示被配置成连续搜索实时声音(例如,言语)特
征与训练模型之间的对齐的设备(或包括用于将设备配置成连续搜索实时声音特征与训练模型之间的对齐的指令的软件)。通常,每当唤醒词检测器确定检测到唤醒词的概率超过预定义阈值,就会触发唤醒词事件。例如,所述阈值可以是被调整以在错误接受率与错误拒绝率之间给出合理折衷的预定阈值。在唤醒词事件之后,设备可能会进入一种状态(可以被称为“唤醒”状态或“注意力”状态),在所述状态下设备会收听命令并且将接收到的命令传递给更大、计算更密集的识别器。
[0011]贯穿本公开,包括在权利要求中,“扬声器(speaker)”和“扩音器(loudspeaker)”同义地用于表示由单个扬声器馈送驱动的任何发声换能器(或一组换能器)。一套典型的耳机包括两个扬声器。扬声器可以被实施为包括多个换能器(例如,低音扬声器和高音扬声器),这些换能器全部由单个公共扬声器馈送驱动。在一些情况下,扬声器馈送可以在耦接到不同换能器的不同电路分支中经历不同的处理。
[0012]贯穿本公开,包括在权利要求中,在广义上使用“对”信号或数据执行操作的表达(例如,对信号或数据进行滤波、缩放、变换或施加增益)来表示直接对信号或数据执行操作或对信号或数据的已处理版本(例如,在对其执行操作之前已经历了初步滤波或预处理的信号版本)执行操作。
[0013]贯穿本公开,包括在权利要求中,在广义上使用表达“系统”来表示设备、系统或子系统。例如,实施解码器的子系统可以被称为解码器系统,并且包括这种子系统的系统(例如,响应于多个输入而生成X个输出信号的系统,其中,所述子系统生成其中M个输入,而其他X

M个输入是从外部源接收的)也可以被称为解码器系统。
[0014]贯穿本公开,包括在权利要求中,在广义上使用术语“处理器”来表示可编程或以其他方式可配置(例如,用软件或固件)为对数据(例如,音频、视频或其他图像数据)执行操作的系统或设备。处理器的示例包括现场可编程门阵列(或其他可配置集成电路或芯片组)、被编程和/或以其他方式被配置成对音频或其他声音数据执行流水线式处理的数字信号处理器、可编程通用处理器或计算机,以及可编程微处理器芯片或芯片组。

技术实现思路

[0015]本公开的至少一些方面可以经由方法来实施。一些这样的方法可以涉及音频设备定位,即确定环境中的多个(例如至少四个或更多个)音频设备的位置的方法。例如,一些方法可以涉及获得多个音频设备中的每个音频设备的到达方向(DOA)数据以及基于所述DOA数据确定多个三角形中的每一个的内角。在一些实例中,多个三角形中的每个三角形可以具有与三个音频设备的音频设备位置相对应的顶点。一些这样的方法可以涉及至少部分地基于内角来确定每个三角形的每条边的边长。
[0016]一些这样的方法可以涉及执行将多个三角形中的每一个以第一顺序对齐的前向对齐过程,以产生前向对齐矩阵。一些这样的方法可以涉及执行将多个三角形中的每一个以与第一顺序反向的第二顺序对齐的反向对齐过程,以产生反向对齐矩阵。一些这样的方法可以涉及至少部分地基于前向对齐矩阵的值和反向对齐矩阵的值来产生每个音频设备位置的最终估计。
[0017]根据一些示例,产生每个音频设备位置的最终估计可以涉及平移和缩放前向对齐矩阵以产生经平移和缩放的前向对齐矩阵,以及平移和缩放反向对齐矩阵以产生经平移和
缩放的反向对齐矩阵。一些这样的方法可以涉及基于所述经平移和缩放的前向对齐矩阵和所述经平移和缩放的反向对齐矩阵来产生旋转矩阵。旋转矩阵可以包括每个音频设备的多个估计音频设备位置。在一些实施方式中,产生旋转矩阵可以涉及对经平移和缩放的前向对齐矩阵以及经平移和缩放的反向对齐矩阵执行奇异值分解。根据一些示例,产生每个音频设备位置的最终估计也可以涉及对每个音频设备的估计音频设备位置求平均,以产生每个音频设备位置的最终估计。
[0018]在一些实施方式中,确定边长可以涉及确定三角形的第一边的第一长度以及基于三角形的内角确定三角形的第二边和第三边的长度。在一些示例中,确定第一长度可以涉及将第一长度设置为预定值。在一些示例中,确定第一长度可以基于到达时间数据和/或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种确定环境中的多个至少四个音频设备的位置的方法,每个音频设备被配置成检测由所述多个音频设备中的不同音频设备产生的信号,所述方法包括:基于由所述环境中的所述多个音频设备中的另一个音频设备产生的所述信号的检测到的方向来获得到达方向(DOA)数据;基于所述到达方向数据确定多个三角形中的每一个的内角,所述多个三角形中的每个三角形具有与所述多个音频设备中的三个音频设备的位置相对应的顶点;基于所述内角以及由要确定的边长分隔开的音频设备产生的所述信号确定所述三角形中的每一个的每条边的边长;或基于所述内角确定所述边长,其中,所述三角形中的一个三角形的一个边长被设置为预定值;执行将所述多个三角形中的每一个以第一顺序对齐的前向对齐过程以产生前向对齐矩阵,其中,所述前向对齐过程是通过强制每个三角形的边长与相邻三角形的边长一致并使用针对所述相邻三角形确定的所述内角来执行的;执行将所述多个三角形中的每一个对齐的反向对齐过程以产生反向对齐矩阵,其中,所述反向对齐过程如所述前向对齐过程那样的方式但以与所述第一顺序相反的第二顺序执行;以及至少部分地基于所述前向对齐矩阵的值和所述反向对齐矩阵的值来产生每个音频设备位置的最终估计。2.如权利要求1所述的方法,其中,产生每个音频设备位置的所述最终估计包括:平移和缩放所述前向对齐矩阵以产生经平移和缩放的前向对齐矩阵;以及平移和缩放所述反向对齐矩阵以产生经平移和缩放的反向对齐矩阵,其中,平移和缩放所述前向对齐矩阵和所述反向对齐矩阵包括将相应矩阵的质心移动到原点并且将每个矩阵的弗罗贝尼乌斯范数强制为一。3.如权利要求2所述的方法,其中,产生每个音频设备位置的所述最终估计进一步包括基于所述经平移和缩放的前向对齐矩阵和所述经平移和缩放的反向对齐矩阵来产生另外的矩阵,所述另外的矩阵包括每个音频设备的多个估计音频设备位置。4.如权利要求3所述的方法,其中,产生所述另外的矩阵包括对所述经平移和缩放的前向对齐矩阵和所述经平移和缩放的反向对齐矩阵执行奇异值分解。5.如前述权利要求中任一项所述的方法,其中,产生每个音频设备位置的所述最终估计进一步包括对从多个三角形的重叠顶点获得的所述音频设备的所述位置的多个估计求平均。6.如权利要求1至5中任一项所述的方法,其中,确定所述边长涉及:确定三角形的第一边的第一长度;以及基于所述三角形的所述内角确定所述三角形的第二边和第三边的长度,其中,确定所述第一长度涉及将所述第一长度设置为预定值,或者其中,确定所述第一长度基于到达时间数据或接收信号强度数据中的至少一者。7.如权利要求1至6中任一项所述的方法,其中,每个音频设备包括多个音频设备麦克风,并且其中,确定所述到达方向数据涉及从与所述多个音频设备中的单个音频设备相对应的多个音频设备麦克风中的每个麦克风接收麦克风数据、以及至少部分地基于所述麦克
风数据确定所述单个音频设备的所述到达方向数据。8.如权利要求1至6中任一项所述的方法,其中,每个音频设备包括一个或多个天线,并且其中,确定所述到达方向数据涉及从与所述多个音频设备中的单个音频设备相对应的一个或多个天线接收天线数据、以及至少部分地基于所述天线数据确定所述单个音频设备的所述到达方向数据。9.如权利要求1至8中任一项所述的方法,进一步包括至少部分地基于至少一个音频设备位置的所述最终估计来控制所述音频设备中的至少一个音频设备。10.如权利要求9所述的方法,其中,所述多个音频设备中的每个音频设备包括扩音器,并且其中,控制所述音频设备中的至少一个音频设备涉及控制所述音频设备中的至少一个音频设备的扩音器。11.一种装置,所述装置被配置成...

【专利技术属性】
技术研发人员:M
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1