当前位置: 首页 > 专利查询>苹果公司专利>正文

检测数字助理的触发制造技术

技术编号:22596194 阅读:61 留言:0更新日期:2019-11-20 11:48
本公开涉及检测数字助理的触发。提供了用于操作智能自动化助理的系统和过程。根据一个示例,一种方法包括:在具有一个或多个处理器、存储器和多个麦克风的电子设备处,在所述电子设备的所述多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;处理所述多个音频信号以获得多个音频流;并且基于所述多个音频流确定所述多个音频信号中的任一个是否对应于语音触发。所述方法还包括:根据确定所述多个音频信号对应于所述语音触发,发起所述数字助理的会话;并且根据确定所述多个音频信号不对应于所述语音触发,放弃发起所述数字助理的会话。

Detect trigger of digital assistant

The present disclosure relates to the detection of triggering of a digital assistant. The system and process for operating intelligent automation assistant are provided. According to an example, a method includes: sampling an audio signal at each of the plurality of microphones of an electronic device having one or more processors, memories, and microphones to obtain a plurality of audio signals; processing the plurality of audio signals to obtain a plurality of audio streams; and determining the plurality of audio streams based on the plurality of audio streams Whether any one of the multiple audio signals corresponds to voice triggering. The method also includes: initiating a session of the digital assistant according to determining that the plurality of audio signals correspond to the voice trigger; and abandoning the session of initiating the digital assistant according to determining that the plurality of audio signals do not correspond to the voice trigger.

【技术实现步骤摘要】
检测数字助理的触发本申请是申请号为201880002529.3、国际申请日为2018年4月25日、专利技术名称为“检测数字助理的触发”的专利技术专利申请的分案申请。本申请要求以下专利申请的优先权:美国临时专利申请No.62/507,042,名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”,2017年5月16日提交;丹麦专利申请No.PA201770420,名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”,2017年5月31日提交;和丹麦专利申请No.PA201770421,名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”,2017年5月31日提交。以上专利申请的内容据此全文以引用方式并入。
本专利技术整体涉及智能自动化助理,更具体地讲,涉及检测数字助理的触发。
技术介绍
智能自动化助理(或数字助理)可在人类用户与电子设备之间提供有利界面。此类助理可允许用户使用自然语言以语音形式和/或文本形式与设备或系统进行交互。例如,用户可向正在电子设备上运行的数字助理提供包含用户请求的语音输入。数字助理可从该语音输入解译用户意图并且将用户意图操作化成任务。随后可通过执行电子设备的一项或多项服务来执行这些任务,并且可将响应于用户请求的相关输出返回给用户。在一些情况下,电子设备经由一个或多个麦克风对来自周围环境的音频信号进行采样,以检测用户是否说出用于发起数字助理会话(例如,“嗨西丽”)的触发。然而,被采样音频信号可能包括干扰音频信号,诸如来自竞争说话者(例如,物理上接近电子设备的用户以外的人)的语音、来自噪声源(例如,房间中的电视)的音频输出、混响等。因此,电子设备可能由于干扰噪声而未能检测到来自用户的语音触发,或者可能错误地检测到来自干扰音频信号的语音触发(例如,误将竞争说话者发出的“History(历史)”误认为“HeySiri(嗨西丽)”)。此外,电子设备可能无法区分针对数字助理的被采样音频信号的部分和不针对数字助理的被采样音频信号的部分(例如,两个说话者之间的对话)。这继而导致用户体验混乱和低效,因为电子设备可能在用户没有发出语音触发时发起数字助理会话,在用户发出语音触发时未能发起数字助理会话,并且/或者误解用户对数字助理的请求。
技术实现思路
本文公开了示例方法。一种示例方法包括:在具有一个或多个处理器、存储器和多个麦克风的电子设备处,在电子设备的多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;处理多个音频信号以获得多个音频流;基于多个音频流确定多个音频信号中的任一个是否对应于语音触发。该方法还包括:根据确定多个音频信号对应于语音触发,由电子设备发起数字助理的会话;并且根据确定多个音频信号不对应于语音触发,放弃发起数字助理的会话。一种示例方法包括:使用第一电子设备的第一麦克风对第一音频信号进行采样;使用不同于第一电子设备的第二电子设备的第二麦克风对第二音频信号进行采样;并且在第三电子设备处确定第一音频信号和第二音频信号中的任一个是否对应于语音触发。该方法还包括:根据确定第一音频信号或第二音频信号对应于语音触发,由第四电子设备发起数字助理的会话;并且根据确定第一音频信号和第二音频信号不对应于语音触发,放弃由第四电子设备发起数字助理的会话。本文公开了示例非暂态计算机可读介质。一种示例非暂态计算机可读存储介质存储一个或多个程序。一个或多个程序包括这样的指令,其在由具有多个麦克风的电子设备的一个或多个处理器执行时,使得电子设备:在电子设备的多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;处理多个音频信号以获得多个音频流;基于多个音频流确定多个音频信号中的任一个是否对应于语音触发,根据确定多个音频信号对应于语音触发,由电子设备发起数字助理的会话;根据确定多个音频信号不对应于语音触发,放弃发起数字助理的会话。一个或多个示例非暂态计算机可读存储介质存储一个或多个程序。一个或多个程序包括这样的指令,其在由一个或多个电子设备的一个或多个处理器执行时,使得一个或多个电子设备:使用一个或多个电子设备中的第一电子设备的第一麦克风对第一音频信号进行采样;使用一个或多个电子设备中的第二电子设备的第二麦克风对第二音频信号进行采样,其中第二电子设备与第一电子设备不同。一个或多个程序还包括这样的指令,其使一个或多个电子设备:在一个或多个电子设备中的第三电子设备处确定第一音频信号和第二音频信号中的任一个是否对应于语音触发;根据确定第一音频信号或第二音频信号对应于语音触发,由一个或多个电子设备中的第四电子设备发起数字助理的会话;根据确定第一音频信号和第二音频信号不对应于语音触发,放弃由第四电子设备发起数字助理的会话。本文公开了示例电子设备。一种示例电子设备包括:一个或多个处理器;存储器;多个麦克风;以及一个或多个程序,其中一个或多个程序存储在存储器中并且被配置为由一个或多个处理器执行。一个或多个程序包括用于以下操作的指令:在电子设备的多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;处理多个音频信号以获得多个音频流;基于多个音频流确定多个音频信号中的任一个是否对应于语音触发,根据确定多个音频信号对应于语音触发,由电子设备发起数字助理的会话;根据确定多个音频信号不对应于语音触发,放弃发起数字助理的会话。一种示例电子设备包括用于以下操作的装置:在电子设备的多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;处理多个音频信号以获得多个音频流;基于多个音频流确定多个音频信号中的任一个是否对应于语音触发;根据确定多个音频信号对应于语音触发,由电子设备发起数字助理的会话;根据确定多个音频信号不对应于语音触发,放弃发起数字助理的会话。本文公开了示例系统。一种示例系统包括:一个或多个电子设备的一个或多个处理器;一个或多个电子设备的一个或多个存储器;以及存储在一个或多个存储器中并且被配置为由一个或多个处理器执行的一个或多个程序。一个或多个程序包括用于以下操作的指令:使用一个或多个电子设备中的第一电子设备的第一麦克风对第一音频信号进行采样;使用一个或多个电子设备中的第二电子设备的第二麦克风对第二音频信号进行采样,其中第二电子设备与第一电子设备不同;在一个或多个电子设备中的第三电子设备处确定第一音频信号和第二音频信号中的任一个是否对应于语音触发;根据确定第一音频信号或第二音频信号对应于语音触发,由一个或多个电子设备中的第四电子设备发起数字助理的会话;根据确定第一音频信号和第二音频信号不对应于语音触发,放弃由第四电子设备发起数字助理的会话。一种示例系统包括用于以下操作的装置:使用第一电子设备的第一麦克风对第一音频信号进行采样;使用不同于第一电子设备的第二电子设备的第二麦克风对第二音频信号进行采样;在第三电子设备处确定第一音频信号和第二音频信号中的任一个是否对应于语音触发;根据确定第一音频信号或第二音频信号对应于语音触发,由本文档来自技高网
...

【技术保护点】
1.一种用于操作数字助理的方法,包括:/n在具有一个或多个处理器、存储器和多个麦克风的电子设备处:/n在所述电子设备的所述多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;/n利用波束形成技术处理所述多个音频信号的至少一部分以获得多个音频流;/n识别所述多个音频流中的音频流的第一段;/n识别所述音频流的第二段;/n确定所述第一段和所述第二段是否对应于同一用户;/n根据确定所述第一段和所述第二段对应于所述同一用户:/n确定该用户是所述电子设备的用户;以及/n基于所述第一段和所述第二段获得用户意图的表示。/n

【技术特征摘要】
20170531 DK PA201770420;20170531 DK PA201770421;201.一种用于操作数字助理的方法,包括:
在具有一个或多个处理器、存储器和多个麦克风的电子设备处:
在所述电子设备的所述多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;
利用波束形成技术处理所述多个音频信号的至少一部分以获得多个音频流;
识别所述多个音频流中的音频流的第一段;
识别所述音频流的第二段;
确定所述第一段和所述第二段是否对应于同一用户;
根据确定所述第一段和所述第二段对应于所述同一用户:
确定该用户是所述电子设备的用户;以及
基于所述第一段和所述第二段获得用户意图的表示。


2.如权利要求1所述的方法,其中所述多个麦克风中的第一麦克风与第一方向相关联,并且所述多个麦克风中的第二麦克风与不同于所述第一方向的第二方向相关联。


3.如权利要求1所述的方法,其中所述多个音频信号包括针对所述数字助理的用户请求以及与所述用户请求分离的背景噪声。


4.如权利要求1所述的方法,其中所述第一段对应于第一用户的语音,并且所述第二段对应于外部电子设备的音频输出。


5.如权利要求1所述的方法,其中所述多个音频流包括多个音频波束。


6.如权利要求5所述的方法,其中所述多个音频波束中的至少一个音频波束是使用源分离而获得的。


7.如权利要求1所述的方法,进一步包括:
基于所述多个音频流确定所述多个音频信号中的任一个是否对应于语音触发;并且
根据确定所述多个音频信号中的任一个对应于所述语音触发,发起所述数字助理的会话;并且
其中识别所述音频流的所述第一段以及识别所述音频流的所述第二段是根据确定所述多个音频信号中的任一个对应于所述语音触发而执行的。


8.如权利要求1所述的方法,其中确定所述第一段和所述第二段是否对应于同一用户包括:
将与所述第一段相关联的声学信息和与所述第二段相关联的声学信息进行比较。


9.如权利要求1所述的方法,其中确定所述第一段与所述第二段是否对应于同一用户包括:
识别与所述第一段相关联的第一熵;
识别与所述第二段相关联的第二熵;以及
将所述第一熵与所述第二熵进行比较。


10.如权利要求1所述的方法,其中确定所述第一段与所述第二段是否对应于同一用户包括:
基于所述第一段和所述第二段识别解析结果;以及
基于与所述解析结果相关联的语义信息确定所述第一段与所述...

【专利技术属性】
技术研发人员:Y·金姆J·布雷德勒J·D·阿特金斯李飞鹏M·索登
申请(专利权)人:苹果公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1