当前位置: 首页 > 专利查询>苹果公司专利>正文

用于媒体探索的智能自动化助理制造技术

技术编号:21958970 阅读:16 留言:0更新日期:2019-08-24 22:16
提供用于操作智能自动化助理的系统和方法。根据一个示例,方法包括:在具有存储器和一个或多个处理器的电子设备处,接收指示对媒体的请求的第一自然语言语音输入,其中所述第一自然语言语音输入包括第一搜索参数;由数字助理提供基于所述第一搜索参数识别的第一媒体项目。该方法还包括:在提供第一媒体项目时,接收第二自然语言语音输入并确定第二输入是否对应于改进对媒体的请求的用户意图。该方法还包括根据确定所述第二语音输入对应于改进对媒体的请求的用户意图:基于所述第一参数和所述第二语音输入来识别第二媒体项目并提供所述第二媒体项目。

Intelligent Automation Assistant for Media Exploration

【技术实现步骤摘要】
【国外来华专利技术】用于媒体探索的智能自动化助理本申请要求于2017年5月16日提交的标题为“INTELLIGENTAUTOMATEDASSISTANTFORMEDIAEXPLORATION”的美国临时专利申请62/506,981;于2017年6月1日提交的标题为“INTELLIGENTAUTOMATEDASSISTANTFORMEDIAEXPLORATION”的丹麦专利申请PA201770425;以及于2017年6月1日提交的标题为“INTELLIGENTAUTOMATEDASSISTANTFORMEDIAEXPLORATION”的丹麦专利申请PA201770426的优先权,其内容据此通过引入整体并入本文。
这通常涉及智能自动化助理,并且更具体地涉及提供数字助理的基于听觉的界面用于媒体探索。
技术介绍
智能自动化助理(或数字助理)可在人类用户和电子设备之间提供有利界面。此类助理可允许用户使用自然语言以口语形式和/或文本形式与设备或系统进行交互。例如,用户可向正在电子设备上运行的数字助理提供包含用户请求的言语输入。数字助理可从该言语输入解译用户意图并且将用户意图操作化成任务。随后可通过执行电子设备的一个或多个服务来执行这些任务,并且可将响应于用户请求的相关输出返回给用户。在大多数情况下,用户至少部分地依靠常规的图形用户界面来与电子设备进行交互。然而,在一些情况下,数字助理可在具有有限或没有显示能力的电子设备上实现。
技术实现思路
本文公开了示例性方法。一种示例方法包括:在具有一个或多个处理器和存储器的电子设备处,接收指示对媒体的请求的第一自然语言语音输入,其中第一自然语言语音输入包括第一搜索参数;由所述数字助理提供第一媒体项目,其中所述第一媒体项目基于所述第一搜索参数来识别;在提供所述第一媒体项目时,接收第二自然语言语音输入;确定所述第二自然语言语音输入是否对应于改进对媒体的请求的用户意图。该方法还包括,根据确定第二自然语言语音输入对应于改进对媒体的请求的用户意图:基于第一参数和第二自然语言语音输入来识别不同于第一媒体项目的第二媒体项目;以及由数字助理提供第二媒体项目。一种示例方法包括:在具有一个或多个处理器和存储器的电子设备处,接收自然语言语音输入;由数字助理基于自然语言语音输入识别任务;由数字助理提供指示与所识别的任务相关联的言语响应的语音输出;并且在提供表示言语响应的语音输出的同时:由数字助理提供对应于言语响应的媒体项目的回放。一种示例方法包括:在具有一个或多个处理器和存储器的电子设备处,接收指示对媒体的请求的语音输入;响应于接收到所述语音输入,由所述数字助理提供指示第一媒体项目的建议的音频输出;由数字助理确定与对媒体的请求相对应的连续的非肯定响应的数量是否满足阈值。该方法还包括,根据连续的非肯定响应的数量不满足阈值的确定:由数字助理提供指示与第一媒体项目不同的第二媒体项目的建议的音频输出。该方法还包括,根据连续的非肯定响应的数量满足阈值的确定:放弃提供指示第二媒体项目的建议的音频输出;以及由数字助理提供指示对用户输入的请求的音频输出。一种示例方法包括:在具有一个或多个处理器和存储器的电子设备处,接收指示对媒体的请求的语音输入;由数字助理检测多个用户对于电子设备的物理存在;响应于检测到所述多个用户的物理存在,获得对应于所述多个用户的多个偏好简档;由数字助理基于多个偏好简档提供合并的偏好简档;由数字助理基于合并的偏好简档来识别媒体项目;以及由数字助理提供包括所识别的媒体项目的音频输出。本文公开了示例性非暂态计算机可读介质。公开了一种存储一个或多个程序的示例性非暂态计算机可读存储介质。该一个或多个程序包括指令,所述指令在由电子设备的一个或多个处理器执行时使电子设备接收指示对媒体的请求的第一自然语言语音输入,其中第一自然语言语音输入包括第一搜索参数;由数字助理提供第一媒体项目,其中基于第一搜索参数识别第一媒体项目;在提供所述第一媒体项目时,接收第二自然语言语音输入;确定第二自然语言语音输入是否对应于改进对媒体的请求的用户意图。所述指令还可使得电子设备根据第二自然语言语音输入对应于改进对媒体的请求的用户意图的确定:基于第一参数和第二自然语言语音输入识别与第一媒体项目不同的第二媒体项目;以及由数字助理提供第二媒体项目。公开了一种存储一个或多个程序的示例性非暂态计算机可读存储介质。所述一个或多个程序包括指令,所述指令在由电子设备的一个或多个处理器执行时使所述电子设备接收自然语言语音输入;由数字助理基于自然语言语音输入识别任务;由数字助理提供指示与所识别的任务相关联的言语响应的语音输出;在提供指示言语响应的语音输出时:由数字助理提供对应于言语响应的媒体项目的回放。公开了一种存储一个或多个程序的示例性非暂态计算机可读存储介质。所述一个或多个程序包括指令,所述指令在由电子设备的一个或多个处理器执行时使所述电子设备接收指示对媒体的请求的语音输入;响应于接收到语音输入,由数字助理提供指示第一媒体项目的建议的音频输出;由数字助理确定与对媒体的请求相对应的多个连续的非肯定响应是否满足阈值。所述指令还可使电子设备根据连续的非肯定响应的数量不满足阈值的确定:由数字助理提供指示不同于第一个媒体项目的第二媒体项目的建议的音频输出。所述指令还可使电子设备根据连续的非肯定响应的数量满足阈值的确定:放弃提供指示第二媒体项目的建议的音频输出;并且由数字助理提供指示对用户输入的请求的音频输出。公开了一种存储一个或多个程序的示例性非暂态计算机可读存储介质。所述一个或多个程序包括指令,所述指令在由电子设备的一个或多个处理器执行时使所述电子设备接收指示对媒体的请求的语音输入;由数字助理检测多个用户对于电子设备的物理存在;响应于检测到所述多个用户的物理存在,获得对应于所述多个用户的多个偏好简档;由所述数字助理基于所述多个偏好简档件来提供合并的偏好简档;由所述数字助理基于所述合并的偏好简档来识别媒体项目;以及由数字助理提供包括所识别的媒体项目的音频输出。本文公开了示例性电子设备。一种示例性电子设备包括一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于接收指示对媒体的请求的第一自然语言语音输入的指令,其中第一自然语言语音输入包括第一搜索参数;由数字助理提供第一媒体项目,其中基于第一搜索参数来识别第一媒体项目;在提供所述第一媒体项目时,接收第二自然语言语音输入;确定第二自然语言语音输入是否对应于改进对媒体的请求的用户意图。该一个或多个程序还包括用于根据确定第二自然语言语音输入对应于改进对媒体的请求的用户意图:基于第一参数和第二自然语言语音输入识别不同于第一媒体项目的第二媒体项目的指令;以及由数字助理提供第二媒体项目。一种示例性电子设备包括一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于接收自然语言语音输入的指令;由数字助理基于所述自然语言语音输入识别任务;由数字助理提供指示与所识别的任务相关联的言语响应的语音输出;在提供表示言语响应的语音输出时:由数字助理提供对应本文档来自技高网...

【技术保护点】
1.一种用于操作数字助理的方法,包括:在具有存储器和一个或多个处理器的电子设备处:接收指示对媒体的请求的第一自然语言语音输入,其中所述第一自然语言语音输入包括第一搜索参数;由所述数字助理提供第一媒体项目,其中基于所述第一搜索参数来识别所述第一媒体项目;在提供所述第一媒体项目时,接收第二自然语言语音输入;确定所述第二自然语言语音输入是否对应于改进对媒体的所述请求的用户意图;根据确定所述第二自然语言语音输入对应于改进对媒体的所述请求的用户意图:基于所述第一参数和所述第二自然语言语音输入来识别不同于所述第一媒体项目的第二媒体项目;以及由所述数字助理提供所述第二媒体项目。

【技术特征摘要】
【国外来华专利技术】2017.06.01 DK PA201770425;2017.06.01 DK PA201770421.一种用于操作数字助理的方法,包括:在具有存储器和一个或多个处理器的电子设备处:接收指示对媒体的请求的第一自然语言语音输入,其中所述第一自然语言语音输入包括第一搜索参数;由所述数字助理提供第一媒体项目,其中基于所述第一搜索参数来识别所述第一媒体项目;在提供所述第一媒体项目时,接收第二自然语言语音输入;确定所述第二自然语言语音输入是否对应于改进对媒体的所述请求的用户意图;根据确定所述第二自然语言语音输入对应于改进对媒体的所述请求的用户意图:基于所述第一参数和所述第二自然语言语音输入来识别不同于所述第一媒体项目的第二媒体项目;以及由所述数字助理提供所述第二媒体项目。2.根据权利要求1所述的方法,还包括:基于所述第一自然语言语音输入获得文本字符串;基于所述文本字符串确定获取对媒体项目的建议的用户意图的表示;以及基于用户意图的所述表示来确定任务和用于执行所述任务的一个或多个参数,其中所述一个或多个参数包括所述第一搜索参数。3.根据权利要求1-2中任一项所述的方法,其中提供所述第一媒体项目包括:由所述数字助理提供指示与所述第一媒体项目相关联的言语响应的语音输出;以及在提供指示所述言语响应的语音输出时,由所述数字助理提供所述第一媒体项目的一部分的回放。4.根据权利要求1-2中任一项所述的方法,其中提供所述第一媒体项目包括:由所述数字助理提供所述第一媒体项目的回放。5.根据权利要求1-2中任一项所述的方法,其中提供所述第一媒体项目包括:由所述数字助理提供多个媒体项目,其中所述多个媒体项目包括所述第一媒体项目。6.根据权利要求1-5中任一项所述的方法,还包括:响应于接收到所述第二自然语言语音输入,调节提供所述第一媒体项目的方式。7.根据权利要求1-6中任一项所述的方法,其中确定所述第二自然语言语音输入是否对应于改进对媒体的所述请求的用户意图包括:基于一个或多个预定义短语和该一个或多个短语的自然语言等同物来导出改进对媒体的所述请求的用户意图的表示。8.根据权利要求1-7中任一项所述的方法,还包括:基于所述第二自然语言语音输入获得用于改进对媒体的所述请求的一个或多个参数。9.根据权利要求8所述的方法,其中确定所述第二自然语言语音输入是否对应于改进对媒体的所述请求的用户意图包括:基于上下文信息来导出改进对媒体的所述请求的用户意图的表示。10.根据权利要求8-9中任一项所述的方法,其中所述一个或多个参数中的参数对应于媒体项目的抒情内容。11.根据权利要求8-10中任一项所述的方法,其中所述一个或多个参数中的参数对应于场合或时间段。12.根据权利要求8-11中任一项所述的方法,其中所述一个或多个参数中的参数对应于活动。13.根据权利要求8-12中任一项所述的方法,其中所述一个或多个参数中的参数对应于位置。14.根据权利要求8-13中任一项所述的方法,其中所述一个或多个参数中的参数对应于情绪。15.根据权利要求8-14中任一项所述的方法,其中所述一个或多个参数中的参数对应于预先确定的时间框架内的发布日期。16.根据权利要求8-15中任一项所述的方法,其中所述一个或多个参数中的参数对应于目标听众。17.根据权利要求8-16中任一项所述的方法,其中所述一个或多个参数中的参数对应于媒体项目的集合。18.根据权利要求8-17中任一项所述的方法:其中所述第二自然语言语音输入与第一用户相关联;以及其中所述一个或多个参数中的参数对应于不同于所述第一用户的第二用户。19.根据权利要求8-18中任一项所述的方法,其中获取用于改进对媒体的所述请求的所述一个或多个参数包括:基于上下文信息确定所述一个或多个参数。20.根据权利要求19所述的方法,其中所述上下文信息包括与所述第一媒体项目相关的信息。21.根据权利要求19所述的方法,还包括:检测一个或多个用户的物理存在,其中所述上下文信息包括与所述一个或多个用户相关的信息。22.根据权利要求19所述的方法,其中所述上下文信息包括与所述电子设备的一个或多个用户相关联的设置。23.根据权利要求8-22中任一项所述的方法,还包括:基于所述第一自然语言语音输入获得第一组媒体项目;从所述第一组媒体项目中选择所述第一媒体项目;基于所述第二自然语言语音输入来获得第二组媒体项目,其中所述第二组媒体项目是所述第一组媒体项目的子集;以及从所述第二组媒体项目中选择所述第二媒体项目。24.根据权利要求23所述的方法,其中获得所述第二组媒体项目包括:基于用于改进对媒体的所述请求的所述一个或多个参数从所述第一组媒体项目中选择一个或多个媒体项目。25.根据权利要求8-24中任一项所述的方法,其中识别所述第二媒体项目包括:确定与所述第二媒体项目相关联的内容是否匹配所述一个或多个参数中的至少一者。26.根据权利要求8-25中任一项所述的方法,其中识别所述第二媒体项目包括:确定与所述第二媒体项目相关联的元数据是否匹配所述一个或多个参数中的至少一者。27.根据权利要求1-26中任一项所述的方法,还包括:从用户特定的媒体项目语料库获得所述第二媒体项目,所述用户特定的媒体项目语料库是基于与用户相关联的数据生成的。28.根据权利要求27所述的方法,还包括:基于与所述第二自然语言语音输入相关联的声学信息来识别所述用户特定的媒体项目语料库。29.根据权利要求27-28中任一项所述的方法,其中所述用户特定的媒体项目语料库中的媒体项目包括指示以下项的元数据:活动;情绪;场合;位置;时间;管理者;播放列表;一个或多个先前的用户输入;或它们的任何组合。30.根据权利要求29所述的方法,其中所述元数据的至少一部分基于来自不同于所述第一用户的第二用户的信息。31.根据权利要求1-30中任一项所述的方法,还包括:接收第三自然语言语音输入;基于所述第三自然语言语音输入确定将所述第二媒体项目与媒体项目的集合相关联的用户意图的表示;将所述第二媒体项目与所述媒体项目的集合相关联;以及由所述数字助理提供指示该关联的音频输出。32.根据权利要求1-31中任一项所述的方法,还包括:在提供所述第二媒体项目时,接收第四自然语言语音输入;基于所述第四自然语言语音输入确定获取与特定媒体项目相关的信息的用户意图的表示;由所述数字助理提供与所述特定媒体项目相关的所述信息。33.根据权利要求32所述的方法,还包括:基于上下文信息选择所述特定媒体项目。34.根据权利要求1-33中任一项所述的方法,还包括:在提供所述第二媒体项目时,由所述数字助理提供指示第三媒体项目的语音输出;在提供所述第二媒体项目之后,提供所述第三媒体项目。35.根据权利要求1-34中任一项所述的方法,其中提供所述第二媒体项目包括:由所述数字助理提供指示与所述第二媒体项目相关联的言语响应的语音输出;以及在提供指示所述言语响应的所述语音输出时,由所述数字助理提供所述第二媒体项目的一部分的回放。36.根据权利要求1-34中任一项所述的方法,其中提供所述第二媒体项目包括:由所述数字助理提供所述第二媒体项目的回放。37.根据权利要求1-34中任一项所述的方法,其中提供所述第二媒体项目包括:由所述数字助理提供多个媒体项目,其中所述多个媒体项目包括所述第二媒体项目。38.根据权利要求1-37中任一项所述的方法,其中所述第一媒体项目为歌曲、有声读物、播客、电台、播放列表、或它们的任何组合。39.根据权利要求1-37中任一项所述的方法,其中所述第二媒体项目为歌曲、有声读物、播客、电台、播放列表、或它们的任何组合。40.根据权利要求1-39中任一项所述的方法,其中所述电子设备为计算机、机顶盒、扬声器、智能手表、电话或它们的组合。41.一种用于操作数字助理的方法,包括:在具有存储器和一个或多个处理器的电子设备处:接收自然语言语音输入;由所述数字助理基于所述自然语言语音输入识别任务;由所述数字助理提供指示与所识别的任务相关联的言语响应的语音输出;在提供指示言语响应的所述语音输出时:由所述数字助理提供对应于所述言语响应的媒体项目的回放。42.根据权利要求41所述的方法,其中基于所述语音输入来识别任务包括:基于所述自然语言语音输入获得文本字符串;解释所述文本字符串以获得用户意图的表示;以及基于用户意图的所述表示来确定所述任务。43.根据权利要求41-42中任一项所述的方法,其中所述自然语言语音输入指示对一个或多个媒体项目的请求;并且其中基于所述自然语言语音输入来识别所述任务包括识别提供一个或多个媒体项目的任务。44.根据权利要求43所述的方法,其中所述媒体项目是第一媒体项目,所述方法还包括:基于所述语音输入来识别第二媒体项目;获取对应于所述第二媒体项目的信息。45.根据权利要求44所述的方法,其中提供指示与所识别的任务相关联的言语响应的语音输出包括:提供所述第二媒体项目的言语描述。46.根据权利要求44-45中任一项所述的方法,其中指示言语响应的所述语音输出在以下项中被提供:所述数字助理的声音,与所述第二媒体项目相关联的声音,或它们的组合。47.根据权利要求44-46中任一项所述的方法,其中所述第一媒体项目对应于所述第二媒体项目的一部分。48.根据权利要求44-47中任一项所述的方法,还包括:在提供所述第一媒体项目的回放时:接收第二自然语言语音输入;响应于接收到所述第二自然语言语音输入,提供所述第二媒体项目的回放。49.根据权利要求48所述的方法,其中所述第二媒体项目的回放以与所述第一媒体项目的回放不同的音量提供。50.根据权利要求44-49中任一项所述的方法,其中指示与所识别的任务相关联的言语响应的所述语音输出为第一语音输出,所述方法还包括:在提供所述第二媒体项目的回放时,提供第二语音输出。51.根据权利要求44-50中任一项所述的方法,其中所述第二媒体项目包括:歌曲、有声读物、播客、电台、播放列表、或它们的组合。52.根据权利要求41所述的方法,还包括:执行所述任务以获得一个或多个结果。53.根据权利要求52所述的方法,其中提供指示与所识别的任务相关联的言语响应的语音输出包括:提供指示所述一个或多个结果中的结果的言语描述的语音输出,并且其中提供对应于所述言语响应的媒体项目的回放包括:提供对应于所述结果的声音效果的回放。54.根据权利要求41-53中任一项所述的方法,其中所述语音输出以第一音量提供,并且其中所述媒体项目的回放以不同于所述第一音量的第二音量提供。55.根据权利要求41-54中任一项所述的方法,其中所述电子设备为计算机、机顶盒、扬声器、智能手表、电话、或它们的组合。56.一种用于操作数字助理的方法,包括:在具有存储器和一个或多个处理器的电子设备处:接收指示对媒体的请求的语音输入;响应于接收到所述语音输入,由所述数字助理提供指示对第一媒体项目的建议的音频输出;由所述数字助理确定对应于对媒体的所述请求的连续非肯定响应的数量是否满足阈值;根据确定所述连续非肯定响应的数量不满足所述阈值:由所述数字助理提供指示对不同于所述第一媒体项目的第二媒体项目的建议的音频输出;根据确定所述连续非肯定响应的数量满足所述阈值:放弃提供指示对第二媒体项目的建议的音频输出;以及由所述数字助理提供指示对用户输入的请求的音频输出。57.根据权利要求56所述的方法,还包括:基于指示对媒体的所述请求的所述语音输入来获得文本字符串;基于所获得的文本字符串,确定用户意图的表示;以及基于用户意图的所述表示获得与一个或多个媒体项目相关的信息,其中所述一个或多个媒体项目包括所述第一媒体项目和所述第二媒体项目。58.根据权利要求56-57中任一项所述的方法,其中指示对媒体的所述请求的所述语音输入是第一语音输入,其中确定对应于对媒体的所述请求的连续非肯定响应的数量是否满足所述阈值包括:在提供指示对所述第一媒体项目的建议的所述音频输出之后,接收第二语音输入;确定所述第二语音输入是否指示对应于对媒体的所述请求的非肯定响应;根据确定所述第二语音输入指示非肯定响应,更新对应于所述请求的连续非肯定响应的数量;根据确定所述第二语音输入不指示非肯定响应,放弃更新对应于所述请求的连续非肯定响应的数量。59.根据权利要求58所述的方法,其中确定所述第二语音输入是否指示对媒体的所述请求的非肯定响应包括:确定所述第二语音输入是否指示拒绝。60.根据权利要求56-57中任一项所述的方法,其中确定对应于对媒体的所述请求的连续非肯定响应的数量是否满足所述阈值包括:在提供指示对所述第一媒体项目的建议的所述音频输出之后,确定对应于所...

【专利技术属性】
技术研发人员:D·C·格拉哈姆C·D·伊拉尼A·皮埃西T·阿尔西娜G·L·韦恩伯格
申请(专利权)人:苹果公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1