The present disclosure relates to the detection of triggering of a digital assistant. The system and process for operating intelligent automation assistant are provided. According to an example, a method includes: sampling an audio signal at each of the plurality of microphones of an electronic device having one or more processors, memories, and microphones to obtain a plurality of audio signals; processing the plurality of audio signals to obtain a plurality of audio streams; and determining the plurality of audio streams based on the plurality of audio streams Whether any one of the multiple audio signals corresponds to voice triggering. The method also includes: initiating a session of the digital assistant according to determining that the plurality of audio signals correspond to the voice trigger; and abandoning the session of initiating the digital assistant according to determining that the plurality of audio signals do not correspond to the voice trigger.
【技术实现步骤摘要】
检测数字助理的触发本申请是申请号为201880002529.3、国际申请日为2018年4月25日、专利技术名称为“检测数字助理的触发”的专利技术专利申请的分案申请。本申请要求以下专利申请的优先权:美国临时专利申请No.62/507,042,名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”,2017年5月16日提交;丹麦专利申请No.PA201770420,名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”,2017年5月31日提交;和丹麦专利申请No.PA201770421,名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”,2017年5月31日提交。以上专利申请的内容据此全文以引用方式并入。
本专利技术整体涉及智能自动化助理,更具体地讲,涉及检测数字助理的触发。
技术介绍
智能自动化助理(或数字助理)可在人类用户与电子设备之间提供有利界面。此类助理可允许用户使用自然语言以语音形式和/或文本形式与设备或系统进行交互。例如,用户可向正在电子设备上运行的数字助理提供包含用户请求的语音输入。数字助理可从该语音输入解译用户意图并且将用户意图操作化成任务。随后可通过执行电子设备的一项或多项服务来执行这些任务,并且可将响应于用户请求的相关输出返回给用户。在一些情况下,电子设备经由一个或多个麦克风对来自周围环境的音频信号进行采样,以检测用户是否说 ...
【技术保护点】
1.一种用于操作数字助理的方法,包括:/n在具有一个或多个处理器、存储器和多个麦克风的电子设备处:/n在所述电子设备的所述多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;/n利用波束形成技术处理所述多个音频信号的至少一部分以获得多个音频流;/n识别所述多个音频流中的音频流的第一段;/n识别所述音频流的第二段;/n确定所述第一段和所述第二段是否对应于同一用户;/n根据确定所述第一段和所述第二段对应于所述同一用户:/n确定该用户是所述电子设备的用户;以及/n基于所述第一段和所述第二段获得用户意图的表示。/n
【技术特征摘要】
20170531 DK PA201770420;20170531 DK PA201770421;201.一种用于操作数字助理的方法,包括:
在具有一个或多个处理器、存储器和多个麦克风的电子设备处:
在所述电子设备的所述多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号;
利用波束形成技术处理所述多个音频信号的至少一部分以获得多个音频流;
识别所述多个音频流中的音频流的第一段;
识别所述音频流的第二段;
确定所述第一段和所述第二段是否对应于同一用户;
根据确定所述第一段和所述第二段对应于所述同一用户:
确定该用户是所述电子设备的用户;以及
基于所述第一段和所述第二段获得用户意图的表示。
2.如权利要求1所述的方法,其中所述多个麦克风中的第一麦克风与第一方向相关联,并且所述多个麦克风中的第二麦克风与不同于所述第一方向的第二方向相关联。
3.如权利要求1所述的方法,其中所述多个音频信号包括针对所述数字助理的用户请求以及与所述用户请求分离的背景噪声。
4.如权利要求1所述的方法,其中所述第一段对应于第一用户的语音,并且所述第二段对应于外部电子设备的音频输出。
5.如权利要求1所述的方法,其中所述多个音频流包括多个音频波束。
6.如权利要求5所述的方法,其中所述多个音频波束中的至少一个音频波束是使用源分离而获得的。
7.如权利要求1所述的方法,进一步包括:
基于所述多个音频流确定所述多个音频信号中的任一个是否对应于语音触发;并且
根据确定所述多个音频信号中的任一个对应于所述语音触发,发起所述数字助理的会话;并且
其中识别所述音频流的所述第一段以及识别所述音频流的所述第二段是根据确定所述多个音频信号中的任一个对应于所述语音触发而执行的。
8.如权利要求1所述的方法,其中确定所述第一段和所述第二段是否对应于同一用户包括:
将与所述第一段相关联的声学信息和与所述第二段相关联的声学信息进行比较。
9.如权利要求1所述的方法,其中确定所述第一段与所述第二段是否对应于同一用户包括:
识别与所述第一段相关联的第一熵;
识别与所述第二段相关联的第二熵;以及
将所述第一熵与所述第二熵进行比较。
10.如权利要求1所述的方法,其中确定所述第一段与所述第二段是否对应于同一用户包括:
基于所述第一段和所述第二段识别解析结果;以及
基于与所述解析结果相关联的语义信息确定所述第一段与所述...
【专利技术属性】
技术研发人员:Y·金姆,J·布雷德勒,J·D·阿特金斯,李飞鹏,M·索登,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。