数字助理系统中的声音识别技术方案

技术编号：26532829 阅读：39 留言：0更新日期：2020-12-01 14:17

本公开涉及数字助理系统中的声音识别。本公开提供了用于操作智能自动化助理的系统和过程。一种示例方法包括从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件；接收自然语言语音输入；基于将自然语言语音输入与多个说话者配置文件进行比较来确定：自然语言语音输入对应于多个用户中的第一用户的第一可能性；以及自然语言语音输入对应于多个用户中的第二用户的第二可能性；确定第一可能性和第二可能性是否在第一阈值内；并且根据确定第一可能性和第二可能性不在第一阈值内：提供对自然语言语音输入的响应，该响应针对第一用户被个性化。

全部详细技术资料下载

【技术实现步骤摘要】
数字助理系统中的声音识别
本公开整体涉及智能自动化助理，更具体地，涉及在多用户或共享环境中识别智能自动化助理的用户。
技术介绍
智能自动化助理(或数字助理)可在人类用户与电子设备之间提供有利界面。此类助理可允许用户使用自然语言以语音形式和/或文本形式与设备或系统进行交互。例如，用户可向正在电子设备上运行的数字助理提供包含用户请求的语音输入。数字助理可从该语音输入解译用户意图并且将用户意图操作化成任务。随后可通过执行电子设备的一项或多项服务来执行这些任务，并且可将响应于用户请求的相关输出返回给用户。数字助理可在由许多用户共享的设备上操作。因此，可能期望数字助理在多用户或共享环境中识别设备的当前用户。
技术实现思路
本文公开了示例方法。一种示例方法包括，在具有存储器和一个或多个处理器的电子设备处：从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件；接收自然语言语音输入；基于将自然语言语音输入与多个说话者配置文件进行比较来确定：自然语言语音输入对应于多个用户中的第一用户的第一可能性；以及自然语...

【技术保护点】
1.一种用于对语音输入作出响应的方法，所述方法包括：/n在具有存储器和一个或多个处理器的电子设备处：/n从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件；/n接收自然语言语音输入；/n基于将所述自然语言语音输入与所述多个说话者配置文件进行比较来确定：/n所述自然语言语音输入与所述多个用户中的第一用户对应的第一可能性；以及/n所述自然语言语音输入与所述多个用户中的第二用户对应的第二可能性，所述第二可能性小于所述第一可能性；/n确定所述第一可能性和所述第二可能性是否在第一阈值内；以及/n根据确定所述第一可能性和所述第二可能性不在所述第一阈值内：/n提供对所述自然语言语音输入的响应，所述...

【技术特征摘要】
20190809 DK PA201970510;20190809 DK PA201970511;201.一种用于对语音输入作出响应的方法，所述方法包括：
在具有存储器和一个或多个处理器的电子设备处：
从一个或多个外部电子设备接收用于多个用户的多个说话者配置文件；
接收自然语言语音输入；
基于将所述自然语言语音输入与所述多个说话者配置文件进行比较来确定：
所述自然语言语音输入与所述多个用户中的第一用户对应的第一可能性；以及
所述自然语言语音输入与所述多个用户中的第二用户对应的第二可能性，所述第二可能性小于所述第一可能性；
确定所述第一可能性和所述第二可能性是否在第一阈值内；以及
根据确定所述第一可能性和所述第二可能性不在所述第一阈值内：
提供对所述自然语言语音输入的响应，所述响应针对所述第一用户被个性化。

2.根据权利要求1所述的方法，其中所述多个说话者配置文件包括：
用于所述第一用户的第一说话者配置文件，所述第一说话者配置文件包括所述第一用户的声音的多个表示；和
用于所述第二用户的第二说话者配置文件，所述第二说话者配置文件包括所述第二用户的声音的多个表示。

3.根据权利要求2所述的方法，其中：
基于所述第一用户的第一话语来确定所述第一用户的所述声音的所述多个表示中的至少一个表示，其中所述第一话语由所述一个或多个外部电子设备中的第一外部电子设备接收，并且其中所述第一外部电子设备与所述第一用户相关联；以及
基于所述第二用户的第二话语来确定所述第二用户的所述声音的所述多个表示中的至少一个表示，其中所述第二话语由所述一个或多个外部电子设备中的第二外部电子设备接收，并且其中所述第二外部电子设备与所述第二用户相关联。

4.根据权利要求2-3中任一项所述的方法，还包括：
确定所述自然语言语音输入的表示；并且其中：
确定所述第一可能性包括将所述自然语言语音输入的所述表示与所述第一用户的所述声音的所述多个表示中的每个表示进行比较；以及
确定所述第二可能性包括将所述自然语言语音输入的所述表示与所述第二用户的所述声音的所述多个表示中的每个表示进行比较。

5.根据权利要求2-4中任一项所述的方法，还包括：
接收第二自然语言语音输入；
确定所述第二自然语言语音输入与所述第一用户还是所述第二用户对应；以及
根据确定所述第二自然语言语音输入与所述第一用户对应：
基于所述第二自然语言语音输入来更新所述第一说话者配置文件；以及
根据确定所述第二自然语言语音输入与所述第二用户对应：
基于所述第二自然语言语音输入来更新所述第二说话者配置文件。

6.根据权利要求1-5中任一项所述的方法，还包括：
确定所述第一可能性是否大于第二阈值。

7.根据权利要求6所述的方法，其中，提供所述响应是进一步根据确定所述第一可能性大于所述第二阈值来执行的。

8.根据权利要求1-7中任一项所述的方法，还包括：
根据确定所述第一可能性和所述第二可能性在所述阈值内：
提供指示对用户身份的请求的输出；
响应于提供指示对用户身份的所述请求的所述输出，接收第三自然语言语音输入；
确定所述第三自然语言语音输入是否与所述第一用户对应；以及
根据确定所述第三自然语言语音输入与所述第一用户对应：
提供对所述自然语言语音输入的所述响应。

9.根据权利要求8所述的方法，其中：
确定所述第三自然语言语音输入与所述第一用户对应包括确定所述第三自然语言语音输入包括所述第一用户的名字。

10.根据权利要求8所述的方法，其中：
指示对用户身份的所述请求的所述输出包括对所述第一用户确认其身份的请求，所述请求包括所述第一用户的第二名字；并且
确定所述第三自然语言语音输入与所述第一用户对应包括确定所述第三自然语言语音输入包括肯定响应。

11.根据权利要求8所述的方法，其中：
指示对用户身份的所述请求的所述输出包括对所述第一用户和所述第二用户之间的用户歧义消除的请求，所述请求包括所述第一用户的第三名字和所述第二用户的名字；并且
确定所述第三自然语言语音输入与所述第一用户对应包括确定所述第三自然语言语音输入包括所述第一用户的所述第三名字。

12.根据权利要求1-11中任一项所述的方法，还包括：
根据确定所述第一可能性和所述第二可能性在所述阈值内：<...

【专利技术属性】
技术研发人员：S·H·沈，C·J·彼得森，S·S·卡贾雷卡，B·S·菲普斯，E·玛奇，J·配克，A·比斯瓦斯，H·西蒙兹，C·曼纳马拉，
申请(专利权)人：苹果公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人