当前位置: 首页 > 专利查询>苹果公司专利>正文

说话者识别制造技术

技术编号:19076268 阅读:38 留言:0更新日期:2018-09-29 18:03
本发明专利技术题为“说话者识别”。一种非暂态计算机可读存储介质存储一个或多个程序,所述一个或多个程序包括指令,所述指令在由电子设备执行时使得所述电子设备从多个用户中的一个用户接收自然语言语音输入,所述自然语言语音输入具有一组声学特性;并且确定所述自然语言语音输入是否对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者;其中根据确定所述自然语言语音输入对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者,调用虚拟助理;并且根据确定所述自然语言语音输入不对应于用户可定制的词汇触发,或所述自然语言语音输入不具有与所述用户相关联的一组声学特性,放弃调用虚拟助理。

【技术实现步骤摘要】
【国外来华专利技术】说话者识别相关专利申请的交叉引用本专利申请要求于2015年9月30日提交的标题为“SPEAKERRECOGNITION”的美国临时专利申请序列号62/235,511和于2016年5月24日提交的标题为“SPEAKERRECOGNITION”的美国专利申请序列号15/163,392的优先权。这些专利申请的内容据此以引用方式并入以用于所有目的。
本公开整体涉及虚拟助理,并且更具体地涉及识别说话者以调用虚拟助理。
技术介绍
智能自动化助理(或数字助理/虚拟助理)在人类用户与电子设备之间提供有利界面。此类助理允许用户使用自然语言以语音形式和/或文本形式与设备或系统进行交互。例如,用户可通过向与电子设备相关联的数字助理提供语音用户请求来访问电子设备的服务。数字助理可根据该语音用户请求解译用户的意图并且将用户意图操作化成任务。随后可通过执行电子设备的一项或多项服务来执行这些任务,并且可将相关输出以自然语言形式返回给用户。就过去用语音命令调用数字助理而言,数字助理对语音本身作出响应,而不是响应于说话者。因此,电子设备拥有者以外的用户能够使用数字助理,这并非在所有情况下都是期望的。此外,由于电子设备本文档来自技高网...

【技术保护点】
1.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储一个或多个程序,所述一个或多个程序包括指令,所述指令当由电子设备执行时,使得所述电子设备:接收来自多个用户中的一个用户的自然语言语音输入,所述自然语言语音输入具有一组声学特性;以及确定所述自然语言语音输入是否对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者;其中根据确定所述自然语言语音输入对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者,调用虚拟助理;并且根据确定所述自然语言语音输入不对应于用户可定制的词汇触发,或所述自然语言语音输入不具有与所述用户相关联的一组声学特性,放弃调用虚拟助理。

【技术特征摘要】
【国外来华专利技术】2015.09.30 US 62/235,511;2016.05.24 US 15/163,3921.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储一个或多个程序,所述一个或多个程序包括指令,所述指令当由电子设备执行时,使得所述电子设备:接收来自多个用户中的一个用户的自然语言语音输入,所述自然语言语音输入具有一组声学特性;以及确定所述自然语言语音输入是否对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者;其中根据确定所述自然语言语音输入对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者,调用虚拟助理;并且根据确定所述自然语言语音输入不对应于用户可定制的词汇触发,或所述自然语言语音输入不具有与所述用户相关联的一组声学特性,放弃调用虚拟助理。2.根据权利要求1所述的存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述一个或多个程序还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:接收至少一个字词的用户输入;以及将所述至少一个字词存储为所述词汇触发。3.根据权利要求1所述的存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述一个或多个程序还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:进一步根据确定所述自然语言语音输入对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者:将所接收的所述用户的自然语言语音输入的所述声学特性与所述虚拟助理可访问的参考组声学特性进行比较;以及存储所述所接收的所述用户的自然语言语音输入的所述声学特性与所述参考组声学特性之间的差异。4.根据权利要求1所述的存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述一个或多个程序还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:进一步根据确定所述自然语言语音输入对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者:请求所述用户说出至少一个预选字词;响应于所述请求,接收说出所述一个或多个预选字词的所述用户的自然语言语音输入。5.根据权利要求1所述的存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,用于确定所述自然语言语音输入是否对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者的所述指令还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:确定所述自然语言语音输入的所述一组声学特性是否与所述虚拟助理可访问的多个用户配置文件中的一者的所述一组声学特性相匹配:根据确定所述自然语言语音输入的所述一组声学特性与所述多个用户配置文件中的一者的所述一组声学特性相匹配,推断所述自然语言语音输入对应于与所述用户相关联的一组声学特性;并且根据确定所述输入与所述多个用户配置文件中的任何一者不匹配,转为放弃调用所述虚拟助理。6.根据权利要求5所述的存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述一个或多个程序还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:为所述电子设备的多个用户中的至少一个用户创建用户配置文件,所述用户配置文件包括用户身份;以及存储所述至少一个用户配置文件。7.根据权利要求5所述的存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述一个或多个程序还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:接收所述电子设备的所述多个用户中的至少一者的用户配置文件,所述用户配置文件包括用户身份。8.根据权利要求5所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:首先确定所述自然语言语音输入是否匹配与所述多个用户配置文件中的至少一者相关联的一组声学特性;以及根据确定所述自然语言语音输入匹配与所述多个用户配置文件中的一者相关联的一组声学特性,继续确定所述自然语言语音输入是否与所述用户可定制的词汇触发相匹配;并且根据确定所述自然语言语音输入与所述多个用户配置文件中的任何一者不匹配,转为放弃调用所述虚拟助理。9.根据权利要求5所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:接收所述用户的除了重复的预选字词之外的自然语言语音输入;将所述所接收的所述用户的自然语言语音输入的所述声学特性与存储在所述用户配置文件中的所述所接收的自然语言语音输入的所述声学特性进行比较;以及确定所述所接收的所述用户的自然语言语音输入的所述声学特性是否明显不同于存储在所述用户配置文件中的所述所接收的自然语言语音输入的所述声学特性:根据确定所述所接收的所述用户的自然语言语音输入的所述声学特性明显不同于存储在所述用户配置文件中的所述所接收的自然语言语音输入的所述声学特性:基于所述所接收的所述用户的自然语言语音输入的所述声学特性来更新所述用户的所述用户配置文件;以及存储更新的用户配置文件;并且根据确定所述所接收的所述用户的自然语言语音输入的所述声学特性未明显不同于存储在所述用户配置文件中的所述所接收的自然语言语音输入的所述声学特性,放弃基于所述所接收的所述用户的自然语言语音输入的所述声学特性来更新所述用户配置文件。10.根据权利要求1所述的存储一个或多个程序的非暂态计算机可读存储介质,所述一个或多个程序包括指令,所述一个或多个程序还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:从所述电子设备发送至少一个用户配置文件。11.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:进一步根据确定所述自然语言语音输入对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者,接收至少一个附加安全标识符;以及确定所述至少一个附加安全标识符是否与所述用户相关联:根据确定所述至少一个附加安全标识符与所述用户相关联,调用所述虚拟助理;根据确定所述至少一个附加安全标识符不与所述用户相关联,放弃调用所述虚拟助理。12.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:登记至少一个用户;其中用于登记至少一个用户的所述指令还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:请求用户说出一个或多个预选字词;响应于所述请求,接收包括对应于所述一个或多个预选字词的自然语言语音输入的用户输入。13.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:在所述用户首次使用所述电子设备期间登记至少一个用户。14.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:在检测到对所述用户的所述语音的所述声学特性的改变时更新至少一个用户的登记。15.根据权利要求14所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:从所述用户请求至少一个附加安全标识符以执行所述登记;以及确定所述至少一个附加安全标识符是否与所述用户相关联:根据确定所述至少一个附加安全标识符与所述用户相关联,登记所述用户;根据确定所述至少一个附加安全标识符不与所述用户相关联,放弃登记所述用户。16.根据权利要求1所述的非暂态计算机可读存储介质,所述非暂态计算机可读存储介质还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:接收对应于与所述用户相关联的一组声学特性而不是所述用户可定制的词汇触发的自然语言语音输入;响应于接收到对应于与所述用户相关联的一组声学特性和所述用户可定制的词汇触发中的一者而不是二者的自然语言语音输入,请求所述用户重复所述自然语言语音输入;以及确定所述重复自然语言语音输入是否对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者;其中根据确定所述自然语言语音输入对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者:调用虚拟助理;以及登记所述用户的第一个自然语言语音输入;以及根据确定所述自然语言语音输入不对应于用户可定制的词汇触发,或所述自然语言语音输入不具有与所述用户相关联的一组声学特性,放弃调用虚拟助理。17.根据权利要求1所述的非暂态计算机可读存储介质,用于确定所述自然语言语音输入是否对应于用户可定制的词汇触发和与所述用户相关联的一组声学特性二者的所述指令还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:存储一个或多个超向量,每个超向量与用户的所述语音的所述声学特性相关联;基于所述自然语言语音输入生成超向量;将生成的超向量与一个或多个存储的超向量进行比较以生成分数;以及确定所述分数是否超过阈值;根据确定所述分数超过所述阈值,推断所述自然语言语音输入对应于与用户相关联的一组声学特性;并且根据确定所述分数不超过所述阈值,推断所述自然语言语音输入不对应于与用户相关联的一组声学特性。18.根据权利要求16所述的非暂态计算机可读存储介质,用于生成超向量的所述指令还包括指令,所述指令当由所述电子设备的所述一个或多个处理器执行时,使得所述设备:利用状态回溯生成所述超向量。19.一种电子设备,包括:一个或多个处理器;存储器;和一个或多个程序,其中所述一个或多个程序存储在权利要求1所述的非暂态计算机可读存储介质中,并被配置为由所述一个或多个处理器执行。20.一种电子设备,包括用于执行存储在权利要求1所述的非暂态计算机可读存储介质中的所述一个或多个程序的装置。21.一种电子设备,包括:存储器;麦克风;和处理器,所述处理器耦接至所述存储器和所述麦克风,所述处理器被配置为:接收来自多个用户中的一个用户的自然语言语音输入,所述自然语言语音输入具有一组声学特性;以及确定所述自然语...

【专利技术属性】
技术研发人员:G·埃弗曼D·R·麦克阿拉斯特
申请(专利权)人:苹果公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1