零延迟数字助理制造技术

技术编号：17785709 阅读：33 留言：0更新日期：2018-04-22 18:17

本发明专利技术题为“零延迟数字助理”。一种电子设备可通过从麦克风捕获音频输入并使用第一处理器将表示所捕获的音频输入的音频数据写到存储缓冲器来实现零延迟数字助理。响应于在捕获音频输入时检测到用户输入，设备可确定用户输入是否满足预先确定的标准。如果用户输入满足标准，则设备可使用第二处理器基于存储缓冲器的内容的至少一部分来识别并执行任务。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】零延迟数字助理相关专利申请的交叉引用本专利申请要求于2015年9月8日提交的标题为“ZEROLATENCYDIGITALASSISTANT”的美国临时专利申请序列号62/215,608和于2016年5月5日提交的标题为“ZEROLATENCYDIGITALASSISTANT”的美国专利申请序列号15/147,726的优先权。该专利申请的内容据此以引用方式并入以用于所有目的。
本公开整体涉及数字助理，并且更具体地涉及减少数字助理延迟。
技术介绍
智能自动化助理(或数字助理)在人类用户与电子设备之间提供有利的界面。此类助理允许用户使用自然语言以语音形式和/或文本形式与设备或系统进行交互。例如，用户可通过向与电子设备相关联的数字助理提供语音用户请求来访问电子设备的服务。数字助理可根据该语音用户请求来解释用户的意图并且将该用户的意图操作化成任务。随后可通过执行电子设备的一项或多项服务来执行所识别的任务，并且可将相关的输出返回给用户。
技术实现思路
用于实现电子设备上的数字助理的一些技术导致用户请求数字助理会话的时间和设备可接收对数字助理的语音输入的时间之间的延迟，这对于用户来说是低效且违反直觉的。现有技术需要比所需更多的时间，这导致浪费用户时间和设备能量。后一种考虑在电池驱动的设备中特别重要。因此，电子设备需要利用用于减小或消除调用数字助理会话的用户所经受的上述延迟的更快更有效的方法和界面。此类方法和界面任选地补充或替换用于提高数字助理的效率和准确性的其他方法。此类方法和界面减少对用户所造成的认知负担，并且产生更有效的人机界面。对于电池驱动的计算设备，此类方法和界面通...
零延迟数字助理

【技术保护点】
一种方法，包括：在包括麦克风、第一处理器和第二处理器的电子设备处：从所述麦克风捕获音频输入；使用所述第一处理器来将表示所捕获的音频输入的数据写到存储缓冲器；在使用所述麦克风来捕获音频输入时检测用户输入；使用所述第一处理器来确定所述用户输入是否已满足预先确定的标准；根据确定所述用户输入已满足所述标准，使用所述第二处理器基于所述存储缓冲器的内容的至少一部分来识别计算任务；以及根据确定所述用户输入尚未满足所述标准，放弃识别所述任务。

【技术特征摘要】
【国外来华专利技术】2015.09.08 US 62/215,608;2016.05.05 US 15/147,7261.一种方法，包括：在包括麦克风、第一处理器和第二处理器的电子设备处：从所述麦克风捕获音频输入；使用所述第一处理器来将表示所捕获的音频输入的数据写到存储缓冲器；在使用所述麦克风来捕获音频输入时检测用户输入；使用所述第一处理器来确定所述用户输入是否已满足预先确定的标准；根据确定所述用户输入已满足所述标准，使用所述第二处理器基于所述存储缓冲器的内容的至少一部分来识别计算任务；以及根据确定所述用户输入尚未满足所述标准，放弃识别所述任务。2.根据权利要求1所述的方法，其中所述存储缓冲器的所述内容的所述至少一部分包括在检测到所述用户输入之前写到所述缓冲器的数据。3.根据权利要求1所述的方法，其中所述存储缓冲器的所述内容的所述至少一部分包括在对所述用户输入的所述检测期间写到所述缓冲器的数据。4.根据权利要求1所述的方法，还包括：进一步根据确定所述用户输入已满足所述标准，执行所识别的计算任务。5.根据权利要求1所述的方法，其中识别所述计算任务包括在所述第二处理器上启动数字助理会话。6.根据权利要求5所述的方法，其中数字助理识别并执行所述计算任务。7.根据权利要求5所述的方法，其中启动所述数字助理会话包括显示与所述数字助理会话相关联的用户界面。8.根据权利要求7所述的方法，其中与所述数字助理相关联的所述用户界面以全屏视图被显示。9.根据权利要求5所述的方法，其中启动所述数字助理会话包括激活所述设备上的一个或多个音频部件。10.根据权利要求5所述的方法，其中所述存储缓冲器的所述内容的所述至少一部分被提供至与所述数字助理相关联的远程服务器。11.根据权利要求1所述的方法，还包括：进一步根据确定所述用户输入已满足所述标准：激活所述设备上的第二麦克风，并且将由所述第二麦克风所检测到的音频流式传输至所述数字助理。12.根据权利要求1所述的方法，其中所述用户输入为按钮按压。13.根据权利要求12所述的方法，其中所述标准包括在所述按钮按压超过预先确定的阈值持续时间时满足的标准。14.根据权利要求1所述的方法，其中所述用户输入为由所述麦克风捕获并写到所述缓冲器的音频数据。15.根据权利要求14所述的方法，其中所述标准包括在所述设备确定所述存储缓冲器的至少第二部分包括表示预先确定的触发器的音频数据时满足的标准。16.根据权利要求14所述的方法，其中所述标准包括在所述设备确定所述音频数据对应于授权用户时满足的标准。17.根据权利要求1所述的方法，其中所述音频输入在所述第二处理器处于低功率模式中时被捕获，所述方法还包括：进一步根据确定所述用户输入已满足所述标准，使得所述第二处理器退出所述低功率模式。18.一种存储一个或多个程序的非暂态计算机可读存储介质，所述一个或多个程序包括指令，所述指令当由具有麦克风的电子设备的第一处理器和第二处理器执行时使得所述设备：从所述麦克风捕获音频输入；使用所述第一处理器来将表示所捕获的音频输入的数据写到存储缓冲器；在使用所述麦克风来捕获音频输入时检测用户输入；使用所述第一处理器来确定所述用户输入是否已满足预先确定的标准；根据确定所述用户输入已满足所述标准，使用所述第二处理器基于所述存储缓冲器的内容的至少一部分来识别计算任务；以及根据确定所述用户输入尚未满足所述标准，放弃识别所述任务。19.一种电子设备，包括：麦克风；两个或更多个处理器；存储器；和一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为将由所述两个或更多个处理器执行，所述一个或多个程序包括用于进行以下操作的指令：从所述麦克风捕获音频输入；使用第一处理器来将表示所捕获的音频输入的数据写到所述存储器中的存储缓冲器；在使用所述麦克风来捕获音频输入时检测用户输入；使用所述第一处理器来确定所述用户输入是否已满足预先确定的标准；根据确定所述用户输入已满足所述标准，使用第二处理器基于所述存储缓冲器的所述内容的至少一部分来识别计算任务；以及根据确定所述用户输入尚未满足所述标准，放弃识别所述任务。20.一种电子设备，包括：麦克风；第一处理器；第二处理器；用于从所述麦克风捕获音频输入的装置；用于使用所述第一处理器来将表示所捕获的音频输入的数据写到存储缓冲器的装置；用于在使用所述麦克风来捕获音频输入时检测用户输入的装置；用于使用所述第一处理器来确定所述用户输入是否已满足预先确定的标准的装置；用于根据确定所述用户输入已满足所述标准而使用所述第二处理器基于所述存储缓冲器的所述内容的至少一部分来识别计算任务的装置；和用于根据确定所述用户输入尚未满足所述标准而放弃识别所述任务的装置。21.一种电子设备，包括：麦克风；至少两个处理器；存储器；和一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为将由所述至少两个处理器执行，所述一个或多个程序包括用于执行根据权利要求1所述的方法的指令。22.一种存储一个或多个程序的非暂态计算机可读存储介质，所述一个或多个程序包括指令，所述指令当由具有麦克风和至少两个处理器的电子设备执行时使得所述设备执行根据权利要求1所述的方法。23.一种电子设备，包括：麦克风；至少两个处理器；和用于执行根据权利要求1所述的方法的装置。24.一种电子设备，包括：麦克风单元；存储缓冲器单元；和处理单元，所述处理单元被耦接至所述麦克风单元和所述存储缓冲器单元，所述处理单元包括第一处理器和第二处理器，所述处理单元被配置为：从所述麦克风捕获音频输入；使用所述第一处理器来将表示所捕获的音频输入的数据写到所述存储缓冲器单元；在使用所述麦克风来捕获音频输入时检测用户输入；使用所述第一处理器来确定所述用户输入是否已满足预先确定的标准；根据确定所述用户输入已满足所述标准，使用所述第二处理器基于所述存储缓冲器的所述内容的至少一部分来识别计算任务；以及根据确定所述用户输入尚未满足所述标准，放弃识别所述任务。25.根据权利要求24所述的电子设备，其中所述存储缓冲器的所述内容的所述至少一部分包括在检测到所述用户输入之前写到所述缓冲器的数据。26.根据权利要求24所述的电子设备，其中所述存储缓冲器的所述内容的所述至少一部分包括在对所述用户输入的所述检测期间写到所述缓冲器的数据。27.根据权利要求24所述的电子设备，其中所述处理单元被进一步配置为：进一步根据确定用户输入已满足所述标准，执行所识别的计算任务。28.根据权利要求24所述的电子设备，其中识别所述计算任务包括在所述第二处理器上启动数字助理会话。29.根据权利要求28所述的电子设备，其中所述数字助理识别并执行所述计算任务。30.根据权利要求28所述的电子设备，其中启动所述数字助理会话包括显示与所述数字助理会话相关联的用户界面。31.根据权利要求30所述的电子设备，其中与所述数字助理相关联的所述用户界面以全屏视图被显示。32.根据权利要求28所述的电子设备，其中启动所述数字助理包括激活所述设备上的一个或多个音频部件。33.根据权利要求28所述的电子设备，其中所述存储缓冲器的所述至少一部分被提供至与所述数字助理相关联的远程服务器。34.根据权利要求28所述的电子设备，其中所述处理单元被进一步配置为：进一步根据确定所述用户输入已满足所述标准：激活所述设备上的第二麦克风，并且将由所述第二麦克风所检测到的音频流式传输至所述数字助理。35.根据权利要求24所述的电子设备，其中所述用户输入为按钮按压。36.根据权利要求35所述的电子设备，其中所述标准包括在所述按钮按压超过预先确定的阈值持续时间时满足的标准。37.根据权利要求24所述的电子设备，其中所述用户输入为由所述麦克风捕获并写到所述缓冲器的音频数据。38.根据权利要求37所述的电子设备，其中所述标准包括在所述设备确定所述缓冲器的至少第二部分包括表示预先确定的触发器的音频数据时满足的标准。39.根据权...

【专利技术属性】
技术研发人员：W·F·斯塔希奥，D·卡森，R·达萨里，Y·金，
申请(专利权)人：苹果公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人