回声参考优先级排序和选择制造技术

技术编号:38989326 阅读:21 留言:0更新日期:2023-10-07 10:19
一些实施方式涉及获得多个回声参考,多个回声参考包括针对音频环境中的多个音频设备中的每个音频设备的至少一个回声参考,每个回声参考对应于由多个音频设备中的一个音频设备的一个或多个扩音器回放的音频数据。一些示例涉及对多个回声参考中的每个回声参考做出重要性估计。做出重要性估计可以涉及确定每个回声参考对由音频环境的至少一个音频设备的至少一个回声管理系统进行的回声减轻的预期贡献。一些实施方式涉及至少部分地基于重要性估计来选择一个或多个所选回声参考并将一个或多个所选回声参考提供给至少一个回声管理系统。系统。

【技术实现步骤摘要】
【国外来华专利技术】回声参考优先级排序和选择
[0001]相关申请的交叉引用
[0002]本申请要求于2021年2月9日提交的美国临时申请No.63/147,573、于2021年5月19日提交的美国临时申请No.63/201,939以及于2021年6月2日提交的欧洲申请No.21177382.5的优先权,所有这些申请均通过援引被整体并入本文。


[0003]本公开涉及用于实施声学回声管理的设备、系统和方法。

技术介绍

[0004]具有声学回声管理系统的音频设备已被广泛部署。声学回声管理系统可以包括声学回声消除器和/或声学回声抑制器。尽管用于声学回声管理的现有设备、系统和方法提供了益处,但改进的设备、系统和方法将仍是期望的。
[0005]符号和术语
[0006]贯穿本公开,包括在权利要求书中,术语“扬声器(speaker)”、“扩音器(loudspeaker)”和“音频再现换能器”同义地用于表示任何发声换能器(或一组换能器)。一套典型的耳机包括两个扬声器。扬声器可以被实施为包括多个换能器(例如,低音扬声器和高音扬声器),所述换能器可以由单个公共扬声器馈送或多个扬声器馈送驱动。在一些示例中,(多个)扬声器馈送可以在耦接到不同换能器的不同电路分支中经历不同处理。
[0007]贯穿本公开,包括在权利要求中,在广义上使用“对信号或数据执行操作(performing an operation“on”a signal or data)”的表达(例如,对信号或数据进行滤波、缩放、变换或应用增益)来表示直接对信号或数据执行操作或对信号或数据的已处理版本(例如,在对其执行操作之前已经历了初步滤波或预处理的信号版本)执行操作。
[0008]贯穿本公开,包括在权利要求中,在广义上使用表达“系统”来表示设备、系统或子系统。例如,实施解码器的子系统可以被称为解码器系统,并且包括这样的子系统的系统(例如,响应于多个输入而生成X个输出信号的系统,其中,所述子系统生成M个输入,而其他X

M个输入是从外部源接收的)也可以被称为解码器系统。
[0009]贯穿本公开,包括在权利要求中,在广义上使用术语“处理器”来表示可编程或以其他方式可配置(例如,用软件或固件)为对数据(例如,音频或视频或其他图像数据)执行操作的系统或设备。处理器的示例包括现场可编程门阵列(或其他可配置集成电路或芯片组)、被编程和/或以其他方式被配置为对音频或其他声音数据执行流水线式处理的数字信号处理器、可编程通用处理器或计算机、以及可编程微处理器芯片或芯片组。
[0010]贯穿本公开,包括在权利要求中,术语“耦接(couple)”或“耦接的(coupled)”用于意指直接或间接连接。因此,如果第一设备耦接到第二设备,则该连接可以通过直接连接或者通过经由其他设备和连接的间接连接实现。
[0011]如本文所使用的,“智能设备”是可以在某种程度上交互地和/或自主地操作的电子设备,其通常被配置用于经由如蓝牙、Zigbee、近场通信、Wi

Fi、光保真(Li

Fi)、3G、4G、
5G等各种无线协议与一个或多个其他设备(或网络)进行通信。一些著名的智能设备类型是智能电话、智能汽车、智能恒温器、智能门铃、智能锁、智能冰箱、平板手机和平板计算机、智能手表、智能手环、智能钥匙链和智能音频设备。术语“智能设备”还可以是指展现出如人工智能等普适计算的一些性质的设备。
[0012]在本文中,使用表达“智能音频设备”来表示智能设备,其是单一用途音频设备或多用途音频设备(例如,实施虚拟助理功能的至少一些方面的音频设备)。单一用途音频设备是包括或耦接到至少一个麦克风(并且可选地还包括或耦接到至少一个扬声器和/或至少一个相机)并且很大程度上或主要被设计为实现单一用途的设备(例如,电视(TV))。例如,尽管TV通常可以播放(并且被认为能够播放)来自节目素材的音频,但在大多数实例中,现代TV运行某种操作系统,应用程序(包括看电视的应用程序)在所述操作系统上本地运行。从这个意义上说,具有(多个)扬声器和(多个)麦克风的单一用途音频设备通常被配置为运行本地应用程序和/或服务以直接使用所述(多个)扬声器和(多个)麦克风。一些单一用途音频设备可以被配置为组合在一起以实现在一定区或用户配置区域上播放音频。
[0013]一种常见类型的多用途音频设备是实施虚拟助理功能的至少一些方面的音频设备,尽管虚拟助理功能的其他方面可以由比如一个或多个服务器等一个或多个其他设备来实施,多用途音频设备被配置用于与所述一个或多个服务器通信。这样的多用途音频设备在本文中可以被称为“虚拟助理”。虚拟助理是包括或耦接到至少一个麦克风(并且可选地还包括或耦接到至少一个扬声器和/或至少一个相机)的设备(例如,智能扬声器或语音助理集成设备)。在一些示例中,虚拟助理可以提供将多个设备(不同于虚拟助理)用于某种意义上支持云的应用程序或以其他方式未在虚拟助理本身中或之上完全实施的应用程序的能力。换句话说,虚拟助理功能的至少一些方面(例如,言语识别功能)可以(至少部分地)由一个或多个服务器或其他设备实施,虚拟助理可以经由网络(如因特网)与所述一个或多个服务器或其他设备通信。虚拟助理有时可以一起工作,例如,以离散和有条件地定义的方式。例如,两个或更多个虚拟助理可以在其中之一(例如,最确信已经听到唤醒词的虚拟助理)对唤醒词作出响应的意义上一起工作。在一些实施方式中,连接的虚拟助理可以形成一种星座,所述星座可以由一个主应用程序管理,所述主应用程序可以是(或实施)虚拟助理。
[0014]在本文中,“唤醒词”在广义上用于表示任何声音(例如,人类说出的词或其他声音),其中智能音频设备被配置成响应于检测到(“听到”)声音(使用包括在智能音频设备中或耦接到所述智能音频设备的至少一个麦克风,或至少一个其他麦克风)而唤醒。在这种背景下,“唤醒”表示设备进入等待(换句话说,正在收听)声音命令的状态。在一些实例中,本文中所谓的“唤醒词”可以包括多于一个词,例如,短语。
[0015]在本文中,表达“唤醒词检测器”表示被配置成连续搜索实时声音(例如,言语)特征与训练模型之间的对齐的设备(或表示包括用于将设备配置成连续搜索实时声音特征与训练模型之间的对齐的指令的软件)。通常,每当唤醒词检测器确定检测到唤醒词的概率超过预定义阈值,就会触发唤醒词事件。例如,所述阈值可以是被调整以在错误接受率与错误拒绝率之间给出合理折衷的预定阈值。在唤醒词事件之后,设备可能会进入一种状态(可以被称为“唤醒”状态或“注意力”状态),在所述状态下设备会收听命令并且将接收到的命令传递给更大、计算更密集的识别器。
[0016]如本文所使用的,术语“节目流”和“内容流”是指一个或多个音频信号的集合,并
且在一些实例中是指视频信号的集合,所述信号集合的至少部分是旨在要一起听到的。示例包括音乐选集、电影原声、电影、电视节目、电视节目的音频部分、播客、现场语音通话、来自智能助理的合成语音响应等。在一些实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于管理音频系统的多个音频设备中的第一音频设备的回声的音频处理方法,其中,所述多个音频设备中的每个音频设备包括一个或多个扩音器,其中,所述第一音频设备进一步包括控制系统,其中,所述控制系统包括回声管理系统,所述回声管理系统包括声学回声消除器(AEC)、声学回声抑制器(AES)、或者AEC和AES两者,所述方法包括:由所述第一音频设备的所述控制系统获得多个回声参考,所述多个回声参考包括针对所述多个音频设备中的每个音频设备的至少一个回声参考,每个回声参考对应于由对应音频设备的所述一个或多个扩音器回放的音频数据;由所述控制系统对所述多个回声参考中的每个回声参考做出重要性估计,其中,做出所述重要性估计涉及由所述第一音频设备的所述回声管理系统确定每个回声参考对回声减轻的预期贡献;由所述控制系统并且至少部分地基于所述重要性估计从所述多个回声参考中选择一个或多个回声参考;由所述控制系统将所述一个或多个所选回声参考提供给所述回声管理系统;以及由所述第一音频设备的所述回声管理系统至少部分地基于所述一个或多个所选回声参考来抑制或消除回声。2.如权利要求1所述的音频处理方法,其中,获得所述多个回声参考涉及:接收包括音频数据的内容流;以及基于所述音频数据确定所述多个回声参考中的一个或多个回声参考。3.如权利要求2所述的音频处理方法,进一步包括:由所述控制系统渲染所述音频数据以供在所述第一音频设备上再现,以产生本地扬声器馈送信号;以及确定与所述本地扬声器馈送信号相对应的本地回声参考。4.如权利要求3所述的音频处理方法,其中,获得所述多个回声参考涉及基于所述音频数据确定一个或多个非本地回声参考,所述非本地回声参考中的每一个对应于用于在所述音频环境的另一音频设备上回放的非本地扬声器馈送信号。5.如权利要求3所述的音频处理方法,其中,获得所述多个回声参考涉及接收一个或多个非本地回声参考,所述非本地回声参考中的每一个对应于用于在所述音频环境的另一音频设备上回放的非本地扬声器馈送信号。6.如权利要求5所述的音频处理方法,其中,接收所述一个或多个非本地回声参考涉及从所述音频环境的一个或多个其他音频设备接收所述一个或多个非本地回声参考。7.如权利要求5所述的音频处理方法,其中,接收所述一个或多个非本地回声参考涉及从所述音频环境的单个其他设备接收所述一个或多个非本地回声参考中的每一个。8.如权利要求1至7中任一项所述的音频处理方法,进一步包括成本确定,所述成本确定涉及确定所述多个回声参考中的至少一个回声参考...

【专利技术属性】
技术研发人员:B
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1