The invention provides a system and process for active assistance based on inter device dialogue communication. In one example, when the voice communication between the electronic device and the second electronic device is established, the audio data stream associated with the second electronic device can be received. In response to detecting user input, a text representation of the voice contained in a part of the audio data stream can be generated. The process can determine whether the text representation contains information corresponding to one type of information in a variety of types of information. In response to determining that the text represents information that contains one type information corresponding to a variety of types of information, one or more tasks can be executed based on the information.
【技术实现步骤摘要】
【国外来华专利技术】基于设备间对话通信的主动协助相关申请的交叉引用本申请要求2015年12月23日提交的名称为“PROACTIVEASSISTANCEBASEDONdialogcommunicationBETWEENDEVICES”的美国临时申请62/387,547和2016年5月31日提交的名称为“PROACTIVEASSISTANCEBASEDONdialogcommunicationBETWEENDEVICES”的美国非临时申请15/169,348的优先权,出于所有目的,这两个申请据此全文以引用方式并入本文。
本申请总体涉及智能自动化助理,更具体地讲,涉及基于设备间对话通信的主动协助。
技术介绍
智能自动化助理(或数字助理)可在人类用户和电子设备之间提供有利界面。此类助理可允许用户使用自然语言以口语形式和/或文本形式与设备或系统进行交互。例如,用户可向正在电子设备上运行的数字助理提供包含用户请求的言语输入。数字助理可从该言语输入解译用户意图并且将用户意图操作化成任务。随后可通过执行电子设备的一个或多个服务来执行这些任务,并且可将响应于用户请求的相关输出返回给用户。通常,可使用电子设备的专用用户界面来实现数字助理。为了获取来自数字助理的协助,用户可能需要导航到专用用户界面并向数字助理提供用户请求。此类动作可能很麻烦,尤其是当用户已经将电子设备用于其他功能时(例如,打电话或对文本消息做出响应)。这可能限制数字助理的应用和效用,从而限制了数字助理的广泛采用。
技术实现思路
本专利技术提供了用于基于设备间对话通信的主动协助的系统和过程。在一个示例过程中,当建立电子设备与第二电子设备 ...
【技术保护点】
1.一种用于基于设备间的对话通信提供主动协助的方法,所述方法包括:在电子设备处:在所述电子设备和第二电子设备之间建立语音通信时:接收与所述第二电子设备相关联的音频数据流;检测用户输入;响应于检测到所述用户输入,生成语音的文本表示,所述语音的文本表示包含在所述音频数据流的一部分中;确定所述文本表示是否包含对应于多种类型信息中的一种类型信息的信息;以及响应于确定所述文本表示包含对应于多种类型信息中的一种类型信息的信息,基于所述信息执行一个或多个任务。
【技术特征摘要】
【国外来华专利技术】2015.12.23 US 62/387,547;2016.05.31 US 15/169,3481.一种用于基于设备间的对话通信提供主动协助的方法,所述方法包括:在电子设备处:在所述电子设备和第二电子设备之间建立语音通信时:接收与所述第二电子设备相关联的音频数据流;检测用户输入;响应于检测到所述用户输入,生成语音的文本表示,所述语音的文本表示包含在所述音频数据流的一部分中;确定所述文本表示是否包含对应于多种类型信息中的一种类型信息的信息;以及响应于确定所述文本表示包含对应于多种类型信息中的一种类型信息的信息,基于所述信息执行一个或多个任务。2.根据权利要求1所述的方法,其中所述用户输入由所述电子设备的物理传感器检测。3.根据权利要求1所述的方法,其中所述电子设备的接近传感器被定位成距表面小于阈值距离,并且其中所述用户输入包括改变所述电子设备的位置,使得所述接近传感器被定位成距所述表面大于所述阈值距离。4.根据权利要求1所述的方法,其中所述用户输入由所述电子设备的加速度计检测,并且其中所述用户输入包括定位所述电子设备以供用户查看所述电子设备的显示器。5.根据权利要求1所述的方法,其中所述用户输入包括选择所述电子设备上的示能表示。6.根据权利要求1所述的方法,其中检测所述用户输入使得将在所述电子设备的显示器上显示用户界面。7.根据权利要求6所述的方法,还包括经由所述用户界面显示所述信息。8.根据权利要求1所述的方法,其中所述用户输入包括用户话语,并且其中检测所述用户输入包括检测所述用户话语中的一个或多个触发字。9.根据权利要求1所述的方法,其中所述用户输入包括语音命令,并且其中检测所述用户输入包括:确定所述语音命令对应于从所述音频数据流提取信息的用户意图。10.根据权利要求1所述的方法,还包括:确定所述信息是否完整;响应于确定所述信息不完整,生成语音的文本表示,所述语音的文本表示包含在与所述音频数据流的所述第一部分不同的所述音频数据流的第二部分中;以及从所述音频数据流的所述第二部分获取第二信息,其中所述一个或多个任务基于所述第二信息。11.根据权利要求1所述的方法,其中所述一个或多个任务包括:存储所述信息;以及提供与所述信息相关联的标记。12.根据权利要求11所述的方法,其中与所述信息相关联的所述标记被提供于第三电子设备上。13.根据权利要求11所述的方法,其中在所述电子设备处于锁定状态时显示第二用户界面,并且其中提供与所述信息相关联的所述标记包括在所述电子设备处于锁定状态时在所述第二用户界面上显示所述标记。14.根据权利要求13所述的方法,还包括:响应于检测到用户选择所述第二用户界面上的所述标记,在所述电子设备上显示所述信息。15.根据权利要求1所述的方法,其中所述一个或多个任务包括显示所述信息。16.根据权利要求15所述的方法,其中经由所述电子设备的第三用户界面显示所述信息。17.根据权利要求16所述的方法,其中在结束所述电子设备和所述第二电子设备之间的所述语音通信之后,所述信息保持在所述电子设备的所述第三用户界面上。18.根据权利要求17所述的方法,其中在结束所述电子设备和所述第二电子设备之间的所述语音通信之后的预先确定的时间,从所述电子设备的所述第三用户界面移除所述信息。19.根据权利要求1所述的方法,其中所述一个或多个任务包括:基于所述信息识别所述电子设备的应用程序;以及在所述应用程序的用户界面上显示所述信息。20.根据权利要求19所述的方法,还包括:响应于检测到与所述应用程序的所述用户界面上的所述信息相关联的第二用户输入,执行使用所述应用程序的相应动作。21.根据权利要求1所述的方法,其中所述一个或多个任务包括将所述信息存储在数据库中,所述数据库与在所述电子设备上实现的数字助理相关联,其中在接收与所述信息相关联的语音命令时,所述电子设备使得从所述数据库检索所述信息。22.根据权利要求1所述的方法,其中所述信息包括电话号码,并且其中所述一个或多个任务包括显示所述电话号码。23.根据权利要求22所述的方法,还包括:响应于检测到用户选择所显示的电话号码,基于所述电话号码发起语音呼叫。24.根据权利要求22所述的方法,还包括:响应于检测到用户选择所显示的电话号码,与所述电子设备的地址簿相关联地存储所述电话号码。25.根据权利要求22所述的方法,还包括:响应于检测到用户选择所显示的电话号码,发起文本消息的撰写,其中所述文本消息的接收人基于所述电话号码。26.根据权利要求1所述的方法,其中所述信息包括电子邮件地址,并且其中所述一个或多个任务包括显示所述电子邮件地址。27.根据权利要求26所述的方法,还包括:响应于检测到用户选择所显示的电子邮件地址,发起电子邮件消息的撰写,其中所述电子邮件消息的接收人基于所述电子邮件地址。28.根据权利要求1所述的方法,其中所述信息包括位置,并且其中所述一个或多个任务包括显示指示所述位置的地图。29.根据权利要求28所述的方法,其中所述一个或多个任务还包括:获取所述电子设备的当前位置;确定从所述电子设备的所述当前位置到所述信息中的所述位置的方向;以及在所述地图上显示所述方向。30.根据权利要求28所述的方法,其中所述一个或多个任务还包括:确定与所述信息中的所述位置相关联的一个或多个兴趣点;以及在所述地图上显示所述一个或多个兴趣点。31.根据权利要求28所述的方法,其中所述一个或多个任务还包括:确定所述电子设备的当前位置和所述信息中的所述位置之间的估计行进时间;以及显示所述估计的行进时间。32.根据权利要求1所述的方法,其中所述信息包括时间信息,其中所述一个或多个任务包括显示对应于所述时间信息的用户时间表,并且其中将所述用户时间表与所述电子设备的日历应用程序相关联地存储于所述电子设备上。33.根据权利要求1所述的方法,其中所述信息包括与时间信息相关联的事件信息,并且其中所述一个或多个任务包括显示所述事件信息。34.根据权利要求33所述的方法,还包括:响应于检测到用户选择所显示的事件信息,在所述电子设备的日历应用程序中生成日历事件,其中所述日历事件基于所述事件信息和所述时间信息。35.根据权利要求1所述的方法,其中所述信息包括交通信息,其中所述一个或多个任务包括获取与所述交通信息相关联的附加信息,并且其中与所述交通信息相关联的所述附加信息包括时间表信息、路线信息、交通工具信息或座位布置信息。36.根据权利要求1所述的方法,其中所述信息包括对应于所述电子设备的地址簿中的联系人的名称,并且其中所述一个或多个任务包括显示所述联系人的联系人信息。37.根据权利要求36所述的方法,还包括:响应于接收到与所显示的联系人信息相关联的第三用户输入,将所述联系人信息发送到所述第二电子设备。38.根据权利要求1所述的方法,其中所述信息包括媒体项的属性,其中所述一个或多个任务包括显示所述媒体项的所述属性。39.根据权利要求38所述的方法,还包括:获取与所述媒体项相关联的媒体信息;以及显示与所述媒体项相关联的所述媒体信息。40.根据权利要求1所述的方法,还包括:确定所述音频数据流的所述一部分是否包括留下语音邮件消息的提示;以及响应于确定所述音频数据流的所述一部分包括留下语音邮件消息的提示:发起地址指向所述第二电子设备的文本消息的撰写。41.根据权利要求40所述的方法,其中基于电话号码在所述电子设备和所述第二电子设备之间建立所述语音通信,并且其中将所述文本消息地址指向所述电话号码。42.根据权利要求1所述的方法,还包括:确定所述音频数据流的所述一部分是否包括自动语音菜单的一部分;以及响应于确定所述音频数据流的所述一部分包括自动语音菜单的一部分,显示所述自动语音菜单的视觉表示。43.根据权利要求1所述的方法,还包括:基于所述音频数据流的所述一部分识别商业实体;以及响应于识别所述商业实体:检索与所述商业实体相关联的用户数据;以及在所述电子设备和所述第二电子设备之间建立语音通信时显示所述用户数据。44.根据权利要求1所述的方法,还包括:确定对应于所述文本表示的域,其中所述域是知识本体的部分,并且其中所述一个或多个任务基于所述域。45.根据权利要求1所述的方法,还包括:将所述音频数据流的所述一部分和所述文本表示存储在所述电子设备的存储器中;以及在执行所述一个或多个任务之后从所述存储器中删除所述音频数据流的所述一部分和所述文本表示。46.根据权利要求1所述的方法,其中所述音频数据流的所述一部分小于整个所述音频数据流。47.根据权利要求1所述的方法,其中所述音频数据流的所述一部分包括在检测所述用户输入之前的所述音频数据流的预先确定的持续时间。48.根据权利要求1所述的方法,还包括:确定所述音频数据流中的句子边界,其中所述音频数据流的所述一部分基于所述句子边界。49.根据权利要求1所述的方法,其中所述音频数据流包括所述第二电子设备的用户的语音数据且不包括所述电子设备的用户的语音数据。50.根据权利要求1所述的方法,还包括:确定所述音频数据流的音频质量是否大于阈值,其中响应于确定所述音频数据流的所述音频质量大于所述阈值来生成所述文本表示。51.根据权利要求1所述的方法,其中使用语音识别模型来生成所述文本表示,所述语音识别模型是利用GSM编码的数字语音数据训练的。52.根据权利要求1所述的方法,其中使用语音识别模型来生成所述文本表示,所述语音识别模型是利用存储在所述电子设备上的用户数据训练的。53.根据权利要求1所述的方法,其中使用经优化以识别地址、电话号码、人名或日期的第二语音识别模型来生成所述文本表示。...
【专利技术属性】
技术研发人员:M·J·马特尔,T·德尼奥,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。