用于媒体探索的智能自动化助理制造技术

技术编号：21958970 阅读：16 留言：0更新日期：2019-08-24 22:16

提供用于操作智能自动化助理的系统和方法。根据一个示例，方法包括：在具有存储器和一个或多个处理器的电子设备处，接收指示对媒体的请求的第一自然语言语音输入，其中所述第一自然语言语音输入包括第一搜索参数；由数字助理提供基于所述第一搜索参数识别的第一媒体项目。该方法还包括：在提供第一媒体项目时，接收第二自然语言语音输入并确定第二输入是否对应于改进对媒体的请求的用户意图。该方法还包括根据确定所述第二语音输入对应于改进对媒体的请求的用户意图：基于所述第一参数和所述第二语音输入来识别第二媒体项目并提供所述第二媒体项目。

Intelligent Automation Assistant for Media Exploration

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于媒体探索的智能自动化助理本申请要求于2017年5月16日提交的标题为“INTELLIGENTAUTOMATEDASSISTANTFORMEDIAEXPLORATION”的美国临时专利申请62/506,981；于2017年6月1日提交的标题为“INTELLIGENTAUTOMATEDASSISTANTFORMEDIAEXPLORATION”的丹麦专利申请PA201770425；以及于2017年6月1日提交的标题为“INTELLIGENTAUTOMATEDASSISTANTFORMEDIAEXPLORATION”的丹麦专利申请PA201770426的优先权，其内容据此通过引入整体并入本文。
这通常涉及智能自动化助理，并且更具体地涉及提供数字助理的基于听觉的界面用于媒体探索。
技术介绍
智能自动化助理(或数字助理)可在人类用户和电子设备之间提供有利界面。此类助理可允许用户使用自然语言以口语形式和/或文本形式与设备或系统进行交互。例如，用户可向正在电子设备上运行的数字助理提供包含用户请求的言语输入。数字助理可从该言语输入解译用户意图并且将用户意图操作化成任务。随后可通过执行电子设备的一个或多个服务来执行这些任务，并且可将响应于用户请求的相关输出返回给用户。在大多数情况下，用户至少部分地依靠常规的图形用户界面来与电子设备进行交互。然而，在一些情况下，数字助理可在具有有限或没有显示能力的电子设备上实现。
技术实现思路
本文公开了示例性方法。一种示例方法包括：在具有一个或多个处理器和存储器的电子设备处，接收指示对媒体的请求的第一自然语言语音输入，其中第一自然语言语音输入...

【技术保护点】
1.一种用于操作数字助理的方法，包括：在具有存储器和一个或多个处理器的电子设备处：接收指示对媒体的请求的第一自然语言语音输入，其中所述第一自然语言语音输入包括第一搜索参数；由所述数字助理提供第一媒体项目，其中基于所述第一搜索参数来识别所述第一媒体项目；在提供所述第一媒体项目时，接收第二自然语言语音输入；确定所述第二自然语言语音输入是否对应于改进对媒体的所述请求的用户意图；根据确定所述第二自然语言语音输入对应于改进对媒体的所述请求的用户意图：基于所述第一参数和所述第二自然语言语音输入来识别不同于所述第一媒体项目的第二媒体项目；以及由所述数字助理提供所述第二媒体项目。

【技术特征摘要】
【国外来华专利技术】2017.06.01 DK PA201770425;2017.06.01 DK PA201770421.一种用于操作数字助理的方法，包括：在具有存储器和一个或多个处理器的电子设备处：接收指示对媒体的请求的第一自然语言语音输入，其中所述第一自然语言语音输入包括第一搜索参数；由所述数字助理提供第一媒体项目，其中基于所述第一搜索参数来识别所述第一媒体项目；在提供所述第一媒体项目时，接收第二自然语言语音输入；确定所述第二自然语言语音输入是否对应于改进对媒体的所述请求的用户意图；根据确定所述第二自然语言语音输入对应于改进对媒体的所述请求的用户意图：基于所述第一参数和所述第二自然语言语音输入来识别不同于所述第一媒体项目的第二媒体项目；以及由所述数字助理提供所述第二媒体项目。2.根据权利要求1所述的方法，还包括：基于所述第一自然语言语音输入获得文本字符串；基于所述文本字符串确定获取对媒体项目的建议的用户意图的表示；以及基于用户意图的所述表示来确定任务和用于执行所述任务的一个或多个参数，其中所述一个或多个参数包括所述第一搜索参数。3.根据权利要求1-2中任一项所述的方法，其中提供所述第一媒体项目包括：由所述数字助理提供指示与所述第一媒体项目相关联的言语响应的语音输出；以及在提供指示所述言语响应的语音输出时，由所述数字助理提供所述第一媒体项目的一部分的回放。4.根据权利要求1-2中任一项所述的方法，其中提供所述第一媒体项目包括：由所述数字助理提供所述第一媒体项目的回放。5.根据权利要求1-2中任一项所述的方法，其中提供所述第一媒体项目包括：由所述数字助理提供多个媒体项目，其中所述多个媒体项目包括所述第一媒体项目。6.根据权利要求1-5中任一项所述的方法，还包括：响应于接收到所述第二自然语言语音输入，调节提供所述第一媒体项目的方式。7.根据权利要求1-6中任一项所述的方法，其中确定所述第二自然语言语音输入是否对应于改进对媒体的所述请求的用户意图包括：基于一个或多个预定义短语和该一个或多个短语的自然语言等同物来导出改进对媒体的所述请求的用户意图的表示。8.根据权利要求1-7中任一项所述的方法，还包括：基于所述第二自然语言语音输入获得用于改进对媒体的所述请求的一个或多个参数。9.根据权利要求8所述的方法，其中确定所述第二自然语言语音输入是否对应于改进对媒体的所述请求的用户意图包括：基于上下文信息来导出改进对媒体的所述请求的用户意图的表示。10.根据权利要求8-9中任一项所述的方法，其中所述一个或多个参数中的参数对应于媒体项目的抒情内容。11.根据权利要求8-10中任一项所述的方法，其中所述一个或多个参数中的参数对应于场合或时间段。12.根据权利要求8-11中任一项所述的方法，其中所述一个或多个参数中的参数对应于活动。13.根据权利要求8-12中任一项所述的方法，其中所述一个或多个参数中的参数对应于位置。14.根据权利要求8-13中任一项所述的方法，其中所述一个或多个参数中的参数对应于情绪。15.根据权利要求8-14中任一项所述的方法，其中所述一个或多个参数中的参数对应于预先确定的时间框架内的发布日期。16.根据权利要求8-15中任一项所述的方法，其中所述一个或多个参数中的参数对应于目标听众。17.根据权利要求8-16中任一项所述的方法，其中所述一个或多个参数中的参数对应于媒体项目的集合。18.根据权利要求8-17中任一项所述的方法：其中所述第二自然语言语音输入与第一用户相关联；以及其中所述一个或多个参数中的参数对应于不同于所述第一用户的第二用户。19.根据权利要求8-18中任一项所述的方法，其中获取用于改进对媒体的所述请求的所述一个或多个参数包括：基于上下文信息确定所述一个或多个参数。20.根据权利要求19所述的方法，其中所述上下文信息包括与所述第一媒体项目相关的信息。21.根据权利要求19所述的方法，还包括：检测一个或多个用户的物理存在，其中所述上下文信息包括与所述一个或多个用户相关的信息。22.根据权利要求19所述的方法，其中所述上下文信息包括与所述电子设备的一个或多个用户相关联的设置。23.根据权利要求8-22中任一项所述的方法，还包括：基于所述第一自然语言语音输入获得第一组媒体项目；从所述第一组媒体项目中选择所述第一媒体项目；基于所述第二自然语言语音输入来获得第二组媒体项目，其中所述第二组媒体项目是所述第一组媒体项目的子集；以及从所述第二组媒体项目中选择所述第二媒体项目。24.根据权利要求23所述的方法，其中获得所述第二组媒体项目包括：基于用于改进对媒体的所述请求的所述一个或多个参数从所述第一组媒体项目中选择一个或多个媒体项目。25.根据权利要求8-24中任一项所述的方法，其中识别所述第二媒体项目包括：确定与所述第二媒体项目相关联的内容是否匹配所述一个或多个参数中的至少一者。26.根据权利要求8-25中任一项所述的方法，其中识别所述第二媒体项目包括：确定与所述第二媒体项目相关联的元数据是否匹配所述一个或多个参数中的至少一者。27.根据权利要求1-26中任一项所述的方法，还包括：从用户特定的媒体项目语料库获得所述第二媒体项目，所述用户特定的媒体项目语料库是基于与用户相关联的数据生成的。28.根据权利要求27所述的方法，还包括：基于与所述第二自然语言语音输入相关联的声学信息来识别所述用户特定的媒体项目语料库。29.根据权利要求27-28中任一项所述的方法，其中所述用户特定的媒体项目语料库中的媒体项目包括指示以下项的元数据：活动；情绪；场合；位置；时间；管理者；播放列表；一个或多个先前的用户输入；或它们的任何组合。30.根据权利要求29所述的方法，其中所述元数据的至少一部分基于来自不同于所述第一用户的第二用户的信息。31.根据权利要求1-30中任一项所述的方法，还包括：接收第三自然语言语音输入；基于所述第三自然语言语音输入确定将所述第二媒体项目与媒体项目的集合相关联的用户意图的表示；将所述第二媒体项目与所述媒体项目的集合相关联；以及由所述数字助理提供指示该关联的音频输出。32.根据权利要求1-31中任一项所述的方法，还包括：在提供所述第二媒体项目时，接收第四自然语言语音输入；基于所述第四自然语言语音输入确定获取与特定媒体项目相关的信息的用户意图的表示；由所述数字助理提供与所述特定媒体项目相关的所述信息。33.根据权利要求32所述的方法，还包括：基于上下文信息选择所述特定媒体项目。34.根据权利要求1-33中任一项所述的方法，还包括：在提供所述第二媒体项目时，由所述数字助理提供指示第三媒体项目的语音输出；在提供所述第二媒体项目之后，提供所述第三媒体项目。35.根据权利要求1-34中任一项所述的方法，其中提供所述第二媒体项目包括：由所述数字助理提供指示与所述第二媒体项目相关联的言语响应的语音输出；以及在提供指示所述言语响应的所述语音输出时，由所述数字助理提供所述第二媒体项目的一部分的回放。36.根据权利要求1-34中任一项所述的方法，其中提供所述第二媒体项目包括：由所述数字助理提供所述第二媒体项目的回放。37.根据权利要求1-34中任一项所述的方法，其中提供所述第二媒体项目包括：由所述数字助理提供多个媒体项目，其中所述多个媒体项目包括所述第二媒体项目。38.根据权利要求1-37中任一项所述的方法，其中所述第一媒体项目为歌曲、有声读物、播客、电台、播放列表、或它们的任何组合。39.根据权利要求1-37中任一项所述的方法，其中所述第二媒体项目为歌曲、有声读物、播客、电台、播放列表、或它们的任何组合。40.根据权利要求1-39中任一项所述的方法，其中所述电子设备为计算机、机顶盒、扬声器、智能手表、电话或它们的组合。41.一种用于操作数字助理的方法，包括：在具有存储器和一个或多个处理器的电子设备处：接收自然语言语音输入；由所述数字助理基于所述自然语言语音输入识别任务；由所述数字助理提供指示与所识别的任务相关联的言语响应的语音输出；在提供指示言语响应的所述语音输出时：由所述数字助理提供对应于所述言语响应的媒体项目的回放。42.根据权利要求41所述的方法，其中基于所述语音输入来识别任务包括：基于所述自然语言语音输入获得文本字符串；解释所述文本字符串以获得用户意图的表示；以及基于用户意图的所述表示来确定所述任务。43.根据权利要求41-42中任一项所述的方法，其中所述自然语言语音输入指示对一个或多个媒体项目的请求；并且其中基于所述自然语言语音输入来识别所述任务包括识别提供一个或多个媒体项目的任务。44.根据权利要求43所述的方法，其中所述媒体项目是第一媒体项目，所述方法还包括：基于所述语音输入来识别第二媒体项目；获取对应于所述第二媒体项目的信息。45.根据权利要求44所述的方法，其中提供指示与所识别的任务相关联的言语响应的语音输出包括：提供所述第二媒体项目的言语描述。46.根据权利要求44-45中任一项所述的方法，其中指示言语响应的所述语音输出在以下项中被提供：所述数字助理的声音，与所述第二媒体项目相关联的声音，或它们的组合。47.根据权利要求44-46中任一项所述的方法，其中所述第一媒体项目对应于所述第二媒体项目的一部分。48.根据权利要求44-47中任一项所述的方法，还包括：在提供所述第一媒体项目的回放时：接收第二自然语言语音输入；响应于接收到所述第二自然语言语音输入，提供所述第二媒体项目的回放。49.根据权利要求48所述的方法，其中所述第二媒体项目的回放以与所述第一媒体项目的回放不同的音量提供。50.根据权利要求44-49中任一项所述的方法，其中指示与所识别的任务相关联的言语响应的所述语音输出为第一语音输出，所述方法还包括：在提供所述第二媒体项目的回放时，提供第二语音输出。51.根据权利要求44-50中任一项所述的方法，其中所述第二媒体项目包括：歌曲、有声读物、播客、电台、播放列表、或它们的组合。52.根据权利要求41所述的方法，还包括：执行所述任务以获得一个或多个结果。53.根据权利要求52所述的方法，其中提供指示与所识别的任务相关联的言语响应的语音输出包括：提供指示所述一个或多个结果中的结果的言语描述的语音输出，并且其中提供对应于所述言语响应的媒体项目的回放包括：提供对应于所述结果的声音效果的回放。54.根据权利要求41-53中任一项所述的方法，其中所述语音输出以第一音量提供，并且其中所述媒体项目的回放以不同于所述第一音量的第二音量提供。55.根据权利要求41-54中任一项所述的方法，其中所述电子设备为计算机、机顶盒、扬声器、智能手表、电话、或它们的组合。56.一种用于操作数字助理的方法，包括：在具有存储器和一个或多个处理器的电子设备处：接收指示对媒体的请求的语音输入；响应于接收到所述语音输入，由所述数字助理提供指示对第一媒体项目的建议的音频输出；由所述数字助理确定对应于对媒体的所述请求的连续非肯定响应的数量是否满足阈值；根据确定所述连续非肯定响应的数量不满足所述阈值：由所述数字助理提供指示对不同于所述第一媒体项目的第二媒体项目的建议的音频输出；根据确定所述连续非肯定响应的数量满足所述阈值：放弃提供指示对第二媒体项目的建议的音频输出；以及由所述数字助理提供指示对用户输入的请求的音频输出。57.根据权利要求56所述的方法，还包括：基于指示对媒体的所述请求的所述语音输入来获得文本字符串；基于所获得的文本字符串，确定用户意图的表示；以及基于用户意图的所述表示获得与一个或多个媒体项目相关的信息，其中所述一个或多个媒体项目包括所述第一媒体项目和所述第二媒体项目。58.根据权利要求56-57中任一项所述的方法，其中指示对媒体的所述请求的所述语音输入是第一语音输入，其中确定对应于对媒体的所述请求的连续非肯定响应的数量是否满足所述阈值包括：在提供指示对所述第一媒体项目的建议的所述音频输出之后，接收第二语音输入；确定所述第二语音输入是否指示对应于对媒体的所述请求的非肯定响应；根据确定所述第二语音输入指示非肯定响应，更新对应于所述请求的连续非肯定响应的数量；根据确定所述第二语音输入不指示非肯定响应，放弃更新对应于所述请求的连续非肯定响应的数量。59.根据权利要求58所述的方法，其中确定所述第二语音输入是否指示对媒体的所述请求的非肯定响应包括：确定所述第二语音输入是否指示拒绝。60.根据权利要求56-57中任一项所述的方法，其中确定对应于对媒体的所述请求的连续非肯定响应的数量是否满足所述阈值包括：在提供指示对所述第一媒体项目的建议的所述音频输出之后，确定对应于所...

【专利技术属性】
技术研发人员：D·C·格拉哈姆，C·D·伊拉尼，A·皮埃西，T·阿尔西娜，G·L·韦恩伯格，
申请(专利权)人：苹果公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人