当前位置: 首页 > 专利查询>苹果公司专利>正文

数字助理系统中的声音识别技术方案

技术编号:26532829 阅读:23 留言:0更新日期:2020-12-01 14:17
本公开涉及数字助理系统中的声音识别。本公开提供了用于操作智能自动化助理的系统和过程。一种示例方法包括从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件;接收自然语言语音输入;基于将自然语言语音输入与多个说话者配置文件进行比较来确定:自然语言语音输入对应于多个用户中的第一用户的第一可能性;以及自然语言语音输入对应于多个用户中的第二用户的第二可能性;确定第一可能性和第二可能性是否在第一阈值内;并且根据确定第一可能性和第二可能性不在第一阈值内:提供对自然语言语音输入的响应,该响应针对第一用户被个性化。

【技术实现步骤摘要】
数字助理系统中的声音识别
本公开整体涉及智能自动化助理,更具体地,涉及在多用户或共享环境中识别智能自动化助理的用户。
技术介绍
智能自动化助理(或数字助理)可在人类用户与电子设备之间提供有利界面。此类助理可允许用户使用自然语言以语音形式和/或文本形式与设备或系统进行交互。例如,用户可向正在电子设备上运行的数字助理提供包含用户请求的语音输入。数字助理可从该语音输入解译用户意图并且将用户意图操作化成任务。随后可通过执行电子设备的一项或多项服务来执行这些任务,并且可将响应于用户请求的相关输出返回给用户。数字助理可在由许多用户共享的设备上操作。因此,可能期望数字助理在多用户或共享环境中识别设备的当前用户。
技术实现思路
本文公开了示例方法。一种示例方法包括,在具有存储器和一个或多个处理器的电子设备处:从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件;接收自然语言语音输入;基于将自然语言语音输入与多个说话者配置文件进行比较来确定:自然语言语音输入对应于多个用户中的第一用户的第一可能性;以及自然语言语音输入对应于多个用户中的第二用户的第二可能性,该第二可能性小于第一可能性;确定第一可能性和第二可能性是否在第一阈值内;并且根据确定第一可能性和第二可能性不在第一阈值内:提供对自然语言语音输入的响应,该响应针对第一用户被个性化。本文公开了示例非暂态计算机可读介质。一种示例非暂态计算机可读存储介质存储一个或多个程序。一个或多个程序包括指令,该指令当由电子设备的一个或多个处理器执行时,使得电子设备:从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件;接收自然语言语音输入;基于将自然语言语音输入与多个说话者配置文件进行比较来确定:自然语言语音输入对应于多个用户中的第一用户的第一可能性;以及自然语言语音输入对应于多个用户中的第二用户的第二可能性,该第二可能性小于第一可能性;确定第一可能性和第二可能性是否在第一阈值内;并且根据确定第一可能性和第二可能性不在第一阈值内:提供对自然语言语音输入的响应,该响应针对第一用户被个性化。本文公开了示例电子设备。一种示例电子设备包括一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序被存储在存储器中并且被配置为由一个或多个处理器执行,该一个或多个程序包括用于如下操作的指令:从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件;接收自然语言语音输入;基于将自然语言语音输入与多个说话者配置文件进行比较来确定:自然语言语音输入对应于多个用户中的第一用户的第一可能性;以及自然语言语音输入对应于多个用户中的第二用户的第二可能性,该第二可能性小于第一可能性;确定第一可能性和第二可能性是否在第一阈值内;并且根据确定第一可能性和第二可能性不在第一阈值内:提供对自然语言语音输入的响应,该响应针对第一用户被个性化。一种示例电子设备包括用于执行以下操作的装置:从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件;接收自然语言语音输入;基于将自然语言语音输入与多个说话者配置文件进行比较来确定:自然语言语音输入对应于多个用户中的第一用户的第一可能性;以及自然语言语音输入对应于多个用户中的第二用户的第二可能性,该第二可能性小于第一可能性;确定第一可能性和第二可能性是否在第一阈值内;并且根据确定第一可能性和第二可能性不在第一阈值内:提供对自然语言语音输入的响应,该响应针对第一用户被个性化。本文公开了示例方法。一种示例方法包括,在具有存储器和一个或多个处理器的电子设备处:接收语音媒体请求;确定多个注册用户中的用户是否对应于所述语音媒体请求;根据确定多个注册用户中的第一用户对应于语音媒体请求:提供对语音媒体请求的第一响应,该第一响应针对第一用户被个性化;并且根据确定多个注册用户中没有用户对应于语音媒体请求:确定语音媒体请求是否包括个人媒体请求;根据确定语音媒体请求包括个人媒体请求:获取提供语音媒体请求的用户的标识;以及根据获取标识:提供对语音媒体请求的第二响应,该第二响应针对提供语音媒体请求的用户被个性化。本文公开了示例非暂态计算机可读介质。一种示例非暂态计算机可读存储介质存储一个或多个程序。一个或多个程序包括指令,该指令当由电子设备的一个或多个处理器执行时使得电子设备:接收语音媒体请求;确定多个注册用户中的用户是否对应于所述语音媒体请求;根据确定多个注册用户中的第一用户对应于语音媒体请求:提供对语音媒体请求的第一响应,该第一响应针对第一用户被个性化;并且根据确定多个注册用户中没有用户对应于语音媒体请求:确定语音媒体请求是否包括个人媒体请求;根据确定语音媒体请求包括个人媒体请求:获取提供语音媒体请求的用户的标识;以及根据获取标识:提供对语音媒体请求的第二响应,该第二响应针对提供语音媒体请求的用户被个性化。本文公开了示例电子设备。一种示例电子设备包括一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序存储在存储器中并且被配置为由一个或多个处理器执行,一个或多个程序包括用于如下操作的指令:接收语音媒体请求;确定多个注册用户中的用户是否对应于所述语音媒体请求;根据确定多个注册用户中的第一用户对应于语音媒体请求:提供对语音媒体请求的第一响应,该第一响应针对第一用户被个性化;并且根据确定多个注册用户中没有用户对应于语音媒体请求:确定语音媒体请求是否包括个人媒体请求;根据确定语音媒体请求包括个人媒体请求:获取提供语音媒体请求的用户的标识;以及根据获取标识:提供对语音媒体请求的第二响应,该第二响应针对提供语音媒体请求的用户被个性化。一种示例电子设备包括用于执行以下操作的装置:接收语音媒体请求;确定多个注册用户中的用户是否对应于所述语音媒体请求;根据确定多个注册用户中的第一用户对应于语音媒体请求:提供对语音媒体请求的第一响应,该第一响应针对第一用户被个性化;并且根据确定多个注册用户中没有用户对应于语音媒体请求:确定语音媒体请求是否包括个人媒体请求;根据确定语音媒体请求包括个人媒体请求:获取提供语音媒体请求的用户的标识;以及根据获取标识:提供对语音媒体请求的第二响应,该第二响应针对提供语音媒体请求的用户被个性化。基于将自然语言语音输入与多个说话者配置文件进行比较来确定:自然语言语音输入对应于多个用户中的第一用户的第一可能性;以及自然语言语音输入对应于多个用户中的第二用户的第二可能性,该第二可能性小于第一可能性允许数字助理识别当前用户。例如,如果数字助理在由许多用户共享的设备上操作,那么数字助理可(例如,基于其语音输入)识别设备的当前用户并且提供针对所识别的用户而个性化的响应(和/或执行任务)(例如,读出用户的文本消息、向用户的日历中添加事件、呼叫用户联系人中的一人等)。因此,由许多用户共享的电子设备可准确识别当前用户并为所识别的用户提供个人内容。这样,可使得用户设备界面更有效率(例如,通过有效率地提供与所识别用户相关的响应,通过增加共享电子设备可提供的信息量,通过防止向未识别用户披露个人信息),而这又通过使得用户能够更快速和高效地使用设备,本文档来自技高网...

【技术保护点】
1.一种用于对语音输入作出响应的方法,所述方法包括:/n在具有存储器和一个或多个处理器的电子设备处:/n从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件;/n接收自然语言语音输入;/n基于将所述自然语言语音输入与所述多个说话者配置文件进行比较来确定:/n所述自然语言语音输入与所述多个用户中的第一用户对应的第一可能性;以及/n所述自然语言语音输入与所述多个用户中的第二用户对应的第二可能性,所述第二可能性小于所述第一可能性;/n确定所述第一可能性和所述第二可能性是否在第一阈值内;以及/n根据确定所述第一可能性和所述第二可能性不在所述第一阈值内:/n提供对所述自然语言语音输入的响应,所述响应针对所述第一用户被个性化。/n

【技术特征摘要】
20190809 DK PA201970510;20190809 DK PA201970511;201.一种用于对语音输入作出响应的方法,所述方法包括:
在具有存储器和一个或多个处理器的电子设备处:
从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件;
接收自然语言语音输入;
基于将所述自然语言语音输入与所述多个说话者配置文件进行比较来确定:
所述自然语言语音输入与所述多个用户中的第一用户对应的第一可能性;以及
所述自然语言语音输入与所述多个用户中的第二用户对应的第二可能性,所述第二可能性小于所述第一可能性;
确定所述第一可能性和所述第二可能性是否在第一阈值内;以及
根据确定所述第一可能性和所述第二可能性不在所述第一阈值内:
提供对所述自然语言语音输入的响应,所述响应针对所述第一用户被个性化。


2.根据权利要求1所述的方法,其中所述多个说话者配置文件包括:
用于所述第一用户的第一说话者配置文件,所述第一说话者配置文件包括所述第一用户的声音的多个表示;和
用于所述第二用户的第二说话者配置文件,所述第二说话者配置文件包括所述第二用户的声音的多个表示。


3.根据权利要求2所述的方法,其中:
基于所述第一用户的第一话语来确定所述第一用户的所述声音的所述多个表示中的至少一个表示,其中所述第一话语由所述一个或多个外部电子设备中的第一外部电子设备接收,并且其中所述第一外部电子设备与所述第一用户相关联;以及
基于所述第二用户的第二话语来确定所述第二用户的所述声音的所述多个表示中的至少一个表示,其中所述第二话语由所述一个或多个外部电子设备中的第二外部电子设备接收,并且其中所述第二外部电子设备与所述第二用户相关联。


4.根据权利要求2-3中任一项所述的方法,还包括:
确定所述自然语言语音输入的表示;并且其中:
确定所述第一可能性包括将所述自然语言语音输入的所述表示与所述第一用户的所述声音的所述多个表示中的每个表示进行比较;以及
确定所述第二可能性包括将所述自然语言语音输入的所述表示与所述第二用户的所述声音的所述多个表示中的每个表示进行比较。


5.根据权利要求2-4中任一项所述的方法,还包括:
接收第二自然语言语音输入;
确定所述第二自然语言语音输入与所述第一用户还是所述第二用户对应;以及
根据确定所述第二自然语言语音输入与所述第一用户对应:
基于所述第二自然语言语音输入来更新所述第一说话者配置文件;以及
根据确定所述第二自然语言语音输入与所述第二用户对应:
基于所述第二自然语言语音输入来更新所述第二说话者配置文件。


6.根据权利要求1-5中任一项所述的方法,还包括:
确定所述第一可能性是否大于第二阈值。


7.根据权利要求6所述的方法,其中,提供所述响应是进一步根据确定所述第一可能性大于所述第二阈值来执行的。


8.根据权利要求1-7中任一项所述的方法,还包括:
根据确定所述第一可能性和所述第二可能性在所述阈值内:
提供指示对用户身份的请求的输出;
响应于提供指示对用户身份的所述请求的所述输出,接收第三自然语言语音输入;
确定所述第三自然语言语音输入是否与所述第一用户对应;以及
根据确定所述第三自然语言语音输入与所述第一用户对应:
提供对所述自然语言语音输入的所述响应。


9.根据权利要求8所述的方法,其中:
确定所述第三自然语言语音输入与所述第一用户对应包括确定所述第三自然语言语音输入包括所述第一用户的名字。


10.根据权利要求8所述的方法,其中:
指示对用户身份的所述请求的所述输出包括对所述第一用户确认其身份的请求,所述请求包括所述第一用户的第二名字;并且
确定所述第三自然语言语音输入与所述第一用户对应包括确定所述第三自然语言语音输入包括肯定响应。


11.根据权利要求8所述的方法,其中:
指示对用户身份的所述请求的所述输出包括对所述第一用户和所述第二用户之间的用户歧义消除的请求,所述请求包括所述第一用户的第三名字和所述第二用户的名字;并且
确定所述第三自然语言语音输入与所述第一用户对应包括确定所述第三自然语言语音输入包括所述第一用户的所述第三名字。


12.根据权利要求1-11中任一项所述的方法,还包括:
根据确定所述第一可能性和所述第二可能性在所述阈值内:<...

【专利技术属性】
技术研发人员:S·H·沈C·J·彼得森S·S·卡贾雷卡B·S·菲普斯E·玛奇J·配克A·比斯瓦斯H·西蒙兹C·曼纳马拉
申请(专利权)人:苹果公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1