检测数字助理的触发制造技术

技术编号：20332192 阅读：23 留言：0更新日期：2019-02-13 07:45

提供了用于操作智能自动化助理的系统和过程。根据一个示例，一种方法包括：在具有一个或多个处理器、存储器和多个麦克风的电子设备处，在所述电子设备的所述多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号；处理所述多个音频信号以获得多个音频流；并且基于所述多个音频流确定所述多个音频信号中的任一个是否对应于语音触发。所述方法还包括：根据确定所述多个音频信号对应于所述语音触发，发起所述数字助理的会话；并且根据确定所述多个音频信号不对应于所述语音触发，放弃发起所述数字助理的会话。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】检测数字助理的触发本申请要求以下专利申请的优先权：美国临时专利申请No.62/507,042，名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”，2017年5月16日提交；丹麦专利申请No.PA201770420，名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”，2017年5月31日提交；和丹麦专利申请No.PA201770421，名称为“DETECTINGATRIGGEROFADIGITALASSISTANT(检测数字助理的触发)”，2017年5月31日提交。以上专利申请的内容据此全文以引用方式并入。
本专利技术整体涉及智能自动化助理，更具体地讲，涉及检测数字助理的触发。
技术介绍
智能自动化助理(或数字助理)可在人类用户与电子设备之间提供有利界面。此类助理可允许用户使用自然语言以语音形式和/或文本形式与设备或系统进行交互。例如，用户可向正在电子设备上运行的数字助理提供包含用户请求的语音输入。数字助理可从该语音输入解译用户意图并且将用户意图操作化成任务。随后可通过执行电子设备的一项或多项服务来执行这些任务，并且可将响应于用户请求的相关输出返回给用户。在一些情况下，电子设备经由一个或多个麦克风对来自周围环境的音频信号进行采样，以检测用户是否说出用于发起数字助理会话(例如，“嗨西丽”)的触发。然而，被采样音频信号可能包括干扰音频信号，诸如来自竞争说话者(例如，物理上接近电子设备的用户以外的人)的语音、来自噪声源(例如，房间中的电视)的音频输出、混响等...

【技术保护点】
1.一种用于操作数字助理的方法，包括：在具有一个或多个处理器、存储器和多个麦克风的电子设备处：在所述电子设备的所述多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号；处理所述多个音频信号以获得多个音频流；基于所述多个音频流确定所述多个音频信号中的任一个是否对应于语音触发：根据确定所述多个音频信号对应于所述语音触发：由所述电子设备发起所述数字助理的会话；根据确定所述多个音频信号不对应于所述语音触发：放弃发起所述数字助理的会话。

【技术特征摘要】
【国外来华专利技术】2017.05.31 DK PA201770420;2017.05.31 DK PA201770421.一种用于操作数字助理的方法，包括：在具有一个或多个处理器、存储器和多个麦克风的电子设备处：在所述电子设备的所述多个麦克风中的每一个处对音频信号进行采样以获得多个音频信号；处理所述多个音频信号以获得多个音频流；基于所述多个音频流确定所述多个音频信号中的任一个是否对应于语音触发：根据确定所述多个音频信号对应于所述语音触发：由所述电子设备发起所述数字助理的会话；根据确定所述多个音频信号不对应于所述语音触发：放弃发起所述数字助理的会话。2.根据权利要求1所述的方法，其中所述多个麦克风中的第一麦克风与第一方向相关联，并且其中所述多个麦克风中的第二麦克风与不同于所述第一方向的第二方向相关联。3.根据权利要求1至2中任一项所述的方法，其中所述多个音频流包括多个音频波束。4.根据权利要求1至3中任一项所述的方法，其中处理所述多个音频信号以获得多个音频流包括使用源分离来处理所述多个音频信号中的音频信号。5.根据权利要求1至4中任一项所述的方法，其中确定所述多个音频信号中的任一个是否对应于所述语音触发包括：确定所述多个音频流中的每一个是否包括所述语音触发。6.根据权利要求1至5中任一项所述的方法，其中确定所述多个音频信号中的任一个是否对应于所述语音触发包括：确定所述多个音频流中的两个以上音频流的组合是否包括所述语音触发。7.根据权利要求1至6中任一项所述的方法，还包括：获得对应于所述多个音频流的一个或多个触发得分；其中确定所述多个音频信号中的任一个是否对应于所述语音触发包括：基于所述一个或多个触发得分确定所述多个音频信号中的任一个是否对应于所述语音触发。8.根据权利要求1至7中任一项所述的方法，其中确定所述多个音频信号中的任一个是否对应于所述语音触发包括：基于与所述电子设备的用户相关联的声学信息确定所述多个音频信号中的任一个是否对应于所述语音触发。9.根据权利要求1至8中任一项所述的方法，还包括：基于所述多个音频流获得多个字词；其中确定所述多个音频信号中的任一个是否对应于所述语音触发包括：基于对应于所述多个字词的信息确定所述多个音频信号中的任一个是否对应于所述语音触发。10.根据权利要求9所述的方法，还包括：基于所述多个字词获得一个或多个解析结果；其中对应于所述多个字词的所述信息包括所述一个或多个解析结果。11.根据权利要求9所述的方法，还包括：基于所述多个字词获得用户意图的一个或多个表示；其中对应于所述多个字词的所述信息包括用户意图的所述一个或多个表示。12.根据权利要求9所述的方法，其中对应于所述多个字词的所述信息指示方向。13.根据权利要求9所述的方法，其中对应于所述多个字词的所述信息指示说话者。14.根据权利要求1至13中任一项所述的方法，其中确定所述多个音频信号中的任一个是否对应于所述语音触发包括：从所述多个音频流中识别一组候选音频流；从所述一组候选音频流中向远程设备提供一个或多个候选音频流；以及从所述远程设备获得验证信息。15.根据权利要求14所述的方法，还包括：基于与所述一个或多个候选音频流相关联的相应触发得分来从所述一组候选音频流中选择所述一个或多个候选音频流。16.根据权利要求15所述的方法，还包括：将所述多个音频流中的每一个音频流提供给神经网络以获得相应的触发得分。17.根据权利要求14所述的方法，还包括：基于与所述一个或多个候选音频流相关联的相应熵信息从所述一组候选音频流中选择所述一个或多个候选音频流。18.根据权利要求14所述的方法，还包括：确定第一候选音频流对应于在第一时间检测到的语音触发；在第二时间确定第二候选音频流对应于在第二时间检测到的语音触发；以及基于所述第一时间和所述第二时间从所述一组候选音频流中选择所述一个或多个候选音频流。19.根据权利要求1至18中任一项所述的方法，还包括：根据确定所述多个音频信号对应于所述语音触发，识别所述多个音频流中的音频流的第一段；识别所述音频流的第二段；确定所述第一段和所述第二段是否对应于同一用户。20.根据权利要求19所述的方法，还包括：根据确定所述第一段和所述第二段对应于所述同一用户，确定该用户是所述电子设备的用户；以及基于所述第一段和所述第二段获得用户意图的表示。21.根据权利要求19至20中任一项所述的方法，其中确定所述第一段和所述第二段是否对应于同一用户包括：将与所述第一段相关联的声学信息与和所述第二段相关联的声学信息进行比较。22.根据权利要求19至20中任一项所述的方法，其中确定所述第一段和所述第二段是否对应于同一用户包括：识别与所述第一段相关联的第一熵；识别与所述第二段相关联的第二熵；以及将所述第一熵与所述第二熵进行比较。23.根据权利要求19至20中任一项所述的方法，其中确定所述第一段和所述第二段是否对应于同一用户包括：基于所述第一段和所述第二段识别解析结果。24.根据权利要求1至23中任一项所述的方法，其中所述电子设备是第一电子设备，所述方法还包括：从第二电子设备接收对应于在所述第二电子设备处检测到的音频信号的信息；其中确定所述多个音频信号中的任一个是否对应于所述语音触发包括：基于从所述第二电子设备接收的所述信息确定在所述第二电子设备处检测到的所述音频信号是否对应于所述语音触发。25.根据权利要求24所述的方法，其中所述信息包括所述第二电子设备的一个或多个麦克风的位置信息。26.根据权利要求24所述的方法，其中所述信息包括在所述第二电子设备处检测到的所述音频信号的方向信息。27.根据权利要求24至26中任一项所述的方法，其中所述信息包括与所述第二电子设备相关联的设备类型。28.根据权利要求24至27中任一项所述的方法，其中所述第二电子设备与和所述第一电子设备不同的设备类型相关联。29.根据权利要求1至28中任一项所述的方法，其中发起所述数字助理的会话包括：由所述数字助理提供音频输出。30.根据权利要求29所述的方法，其中所述多个音频流中的每一个音频流与方向信息相关联，并且其中提供音频输出包括：由所述数字助理基于与所述多个音频流相关联的所述方向信息提供所述音频输出。31.根据权利要求1至30中任一项所述的方法，其中所述多个音频流中的每一个音频流与方向信息相关联，并且其中确定所述多个音频信号中的任一个是否对应于语音触发包括：基于所述多个音频流和相关联的方向信息确定所述多个音频信号中的任一个是否对应于语音触发。32.根据权利要求1至30中任一项所述的方法，其中所述多个音频信号是所述第一多个音频信号，其中确定所述多个音频信号中的任一个是否对应于语音触发包括：从所述多个音频流中的一个或多个音频流中检测所述语音触发，所述方法还包括：基于所述一个或多个音频流选择所述多个麦克风中的一组麦克风；以及使用所述第一组麦克风对第二多个音频信号进行采样。33.根据权利要求1至32中任一项所述的方法，其中所述电子设备是计算机、机顶盒、扬声器、智能手表、电话或其组合。34.一种用于操作数字助理的方法，所述方法包括：使用第一电子设备的第一麦克风对第一音频信号进行采样；使用不同于所述第一电子设备的第二电子设备的第二麦克风对第二音频信号进行采样；在第三电子设备处确定所述第一音频信号和所述第二音频信号中的任一个是否对应于语音触发；根据确定所述第一音频信号或所述第二音频信号对应于语音触发：由第四电子设备发起所述数字助理的会话；根据确定所述第...

【专利技术属性】
技术研发人员：Y·金姆，J·布雷德勒，J·D·阿特金斯，李飞鹏，M·索登，
申请(专利权)人：苹果公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人