The present application provides a system and process for generating a speaker configuration file for performing speaker identification for a virtual assistant. An exemplary process may include receiving an audio input including a user's voice, and determining whether the speaker of the user's speech is a predetermined user based on the speaker profile of the predetermined user. In response to the speaker that determines the user's voice as a predetermined user, the user voice can be added to the speaker configuration file and the operation of the virtual assistant can be triggered. In response to a speaker that determines the user's voice, not a predetermined user, the user voice can be added to the selected speaker configuration file and the operation of the virtual assistant may not be triggered. In some examples, contextual information can be used to verify the results produced by the speaker recognition process.
【技术实现步骤摘要】
【国外来华专利技术】扬声器识别和不受支持的扬声器适配技术相关申请的交叉引用本申请要求2014年9月30日提交的题为“SPEAKERIDENTIFICATIONANDUNSUPERVISEDSPEAKERADAPTATIONTECHNIQUES”的美国临时申请No.62/057,990和2015年8月25日提交的题为“SPEAKERIDENTIFICATIONANDUNSUPERVISEDSPEAKERADAPTATIONTECHNIQUES”的美国非临时申请No.14/835,169的优先权,其全文出于所有目的以引用方式并入本文。
本申请通常涉及自然语言处理,尤其涉及执行针对自然语言处理的扬声器识别。
技术介绍
智能自动助理(或虚拟助理)在用户和电子设备之间提供直观的界面。这些助理可允许用户使用语言和/或文本形式的自然语言与设备或系统交互。例如,用户可通过将自然语言形式的语音用户输入提供给与电子设备相关联的虚拟助理来访问电子设备的服务。虚拟助理可对语音用户输入执行自然语言处理以推断用户意图并将用户意图操作为任务。随后可通过执行电子设备的一个或多个功能执行任务,并且可将相关输出以自然语言形式返回到用户。一些自然语言处理系统可执行扬声器识别来验证用户的身份。这些系统典型地需要用户执行注册过程,在注册过程期间用户说出一系列预先确定的字词或短语来允许自然语言处理系统对用户语音建模。尽管此过程可用来有效地对用户语音建模,但是如果用户在注册过程期间以非自然方式说出和/或如果用户在不同于稍后执行扬声器识别的声学环境下执行注册过程,则该过程可能会产生不可靠的结果。因此,希望用于对用户语音建模 ...
【技术保护点】
一种用于操作虚拟助理的方法,所述方法包括:在电子设备处:在所述电子设备处接收包括用户语音的音频输入;至少部分基于针对预先确定的用户的扬声器配置文件确定所述用户语音的扬声器是否为所述预先确定的用户;以及根据确定所述用户语音的所述扬声器为所述预先确定的用户,将包括用户语音的所述音频输入添加到针对所述预先确定的用户的所述扬声器配置文件。
【技术特征摘要】
【国外来华专利技术】2014.09.30 US 62/057,990;2015.08.25 US 14/835,1691.一种用于操作虚拟助理的方法,所述方法包括:在电子设备处:在所述电子设备处接收包括用户语音的音频输入;至少部分基于针对预先确定的用户的扬声器配置文件确定所述用户语音的扬声器是否为所述预先确定的用户;以及根据确定所述用户语音的所述扬声器为所述预先确定的用户,将包括用户语音的所述音频输入添加到针对所述预先确定的用户的所述扬声器配置文件。2.根据权利要求1所述的方法,其中针对所述预先确定的用户的所述扬声器配置文件包括多个声纹。3.根据权利要求2所述的方法,其中针对所述预先确定的用户的所述扬声器配置文件的所述多个声纹中的每一个由包括用户语音的先前接收的音频输入生成。4.根据权利要求2所述的方法,其中至少部分基于针对所述预先确定的用户的所述扬声器配置文件确定所述用户语音的所述扬声器是否为所述预先确定的用户包括:确定包括用户语音的所述音频输入是否匹配至少阈值数量的所述多个声纹;根据确定包括用户语音的所述音频输入匹配至少所述阈值数量的所述多个声纹,确定所述用户语音的所述扬声器为所述预先确定的用户;以及根据确定包括用户语音的所述音频输入不匹配至少所述阈值数量的所述多个声纹,确定所述用户语音的所述扬声器不是所述预先确定的用户。5.根据权利要求2所述的方法,其中至少部分基于针对所述预先确定的用户的所述扬声器配置文件确定所述用户语音的所述扬声器是否为所述预先确定的用户包括:确定包括用户语音的所述音频输入是否匹配至少阈值数量的所述多个声纹;根据确定包括用户语音的所述音频输入匹配至少所述阈值数量的所述多个声纹:确定错误的扬声器确定是否基于上下文数据做出;根据确定错误的扬声器确定不是基于上下文数据做出,确定所述用户语音的所述扬声器为所述预先确定的用户;以及根据确定错误的扬声器确定基于上下文数据做出,确定所述用户语音的所述扬声器不是所述预先确定的用户;以及根据确定包括用户语音的所述音频输入不匹配至少所述阈值数量的所述多个声纹:确定错误的扬声器确定是否基于上下文数据做出;根据确定错误的扬声器确定不是基于上下文数据做出,确定所述用户语音的所述扬声器不是所述预先确定的用户;以及根据确定错误的扬声器确定基于上下文数据做出,确定所述用户语音的所述扬声器为所述预先确定的用户。6.根据权利要求1所述的方法,其中将包括用户语音的所述音频输入添加到针对所述预先确定的用户的所述扬声器配置文件包括:从包括用户语音的所述音频输入生成声纹;以及将所述声纹与针对所述预先确定的用户的所述扬声器配置文件相关联地存储。7.根据权利要求1所述的方法,其中所述方法还包括:根据确定所述用户语音的所述扬声器不是所述预先确定的用户,将包括用户语音的所述音频输入添加到针对另选的用户的扬声器配置文件。8.根据权利要求7所述的方法,其中针对所述另选的用户的所述扬声器配置文件包括多个声纹。9.根据权利要求8所述的方法,其中针对所述另选的用户的所述扬声器配置文件的所述多个声纹中的每一个由包括用户语音的先前接收的音频输入生成。10.根据权利要求7所述的方法,...
【专利技术属性】
技术研发人员:Y·金,S·S·卡加克卡,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。