基于声学空间的语音触发制造技术

技术编号：36740634 阅读：23 留言：0更新日期：2023-03-04 10:17

本发明专利技术公开了基于声学空间的语音触发。可以获得多个麦克风信号。在多个麦克风信号中，可以检测用户的语音。可以基于多个麦克风信号确定用户的注视。可以响应于用户的注视指向计算设备而执行计算设备的语音激活响应。其他方面也有所描述并受权利要求书保护。面也有所描述并受权利要求书保护。面也有所描述并受权利要求书保护。

全部详细技术资料下载

【技术实现步骤摘要】
基于声学空间的语音触发
[0001]相关申请的交叉引用
[0002]本申请要求提交于2021年9月1日的美国临时专利申请第63/239567号的权益，该申请以引用的方式全文并入本文。

技术介绍

[0003]计算设备诸如例如计算机、扬声器、电视、智能手机、平板计算机和器具在日常环境中为数众多。许多此类计算设备可以存在于共享空间诸如起居室、厨房、大厅、办公室、卧室或其它封闭空间中。一些计算设备具有感测声音的麦克风。麦克风将感测到的声音植入麦克风信号，其中可以承载这些声音以进行进一步处理或存储。

技术实现思路

[0004]计算设备可以处理麦克风信号以检测麦克风信号中的声音。在一些情况下，电子设备可以处理麦克风信号以检测麦克风是否已经拾取了用户的语音。如果存在语音，则设备可以触发语音激活响应，诸如从睡眠状态唤醒、检测或响应语音命令、识别用户和/或其它操作。
[0005]空间诸如起居室、厨房、大厅、办公室、卧室或其它封闭区域可以具有放置在其内的多个计算设备。然而，可能不期望的是，响应于用户的语音而具有每个设备触发。确定针...

【技术保护点】

【技术特征摘要】
1.一种由计算设备执行的方法，包括：获得从多个麦克风生成的多个麦克风信号；在所述多个麦克风信号中检测用户的语音；确定所述语音是否源于与所述计算设备共享的声学空间；基于所述多个麦克风信号来确定用户的注视；以及响应于确定所述语音源于与所述计算设备共享的所述声学空间并且所述用户的所述注视指向所述计算设备，触发所述计算设备的语音激活响应。2.根据权利要求1所述的方法，其中确定所述用户的所述注视包括使用所述多个麦克风信号估计直达混响比(DRR)。3.根据权利要求2所述的方法，其中当所述DRR满足阈值时或者当所述DRR高于从第二设备的麦克风信号确定的第二DRR时，确定所述用户的所述注视指向所述计算设备。4.根据权利要求1所述的方法，其中确定所述用户的所述注视包括从所述多个麦克风信号生成多个声学拾取波束并测量所述多个声学拾取波束中的直达和混响声音。5.根据权利要求1所述的方法，其中：确定所述语音是否源于与所述计算设备共享的所述声学空间是基于经训练的神经网络执行的。6.根据权利要求5所述的方法，其中所述经训练的神经网络被训练以输出置信度得分，所述置信度得分指示所述语音是否源于与所述计算设备共享的所述声学空间。7.根据权利要求5所述的方法，其中所述计算设备是感测所述语音的多个计算设备中的一个计算设备，并且响应于以下而触发所述多个计算设备中的选择的一个计算设备：确定所述语音源于与所述多个计算设备中的所选择的一个计算设备共享的所述声学空间，以及确定所述用户的所述注视指向所述多个计算设备中的所选择的一个计算设备。8.根据权利要求1所述的方法，还包括使用所述麦克风信号中的至少一个麦克风信号执行盲房间估计以确定所述计算设备的声学空间的混响时间，其中所述混响时间用于跟踪所述计算设备的所述声学空间。9.根据权利要求1所述的方法，其中所述语音激活响应包括以下中的至少一者：所述计算设备的唤醒、处理所述语音以检测语音命令、响应所述语音中的语音命令，或基于所述语音确定所述用户的身份。10.一种由计算设备执行的方法，包括：获得从多个麦克风生成的多个麦克风信号；在所述多个麦克风信号中检测用户的语音；利用经训练的神经网络确定所述语音是否源于与所述计算设备共享的声学空间；以及基于所述语音是否源于与所述计算设备共享的所述声学空间来触发所述计算设备的语音激活响应。11.根据权利要求10所述的方法，其中所述经训练的神经网络被训练以输出置信度得分，所述置信度得分指示所述语音是否源于与所述计算设备...

【专利技术属性】
技术研发人员：P，
申请(专利权)人：苹果公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人