The present invention provides a system and process for providing a user-specific acoustic model. According to an example, the method includes receiving multiple voice inputs at an electronic device with one or more processors, each of which is associated with the same user of the electronic device; providing each voice input in multiple voice inputs to a user-independent acoustic model that provides multiple voice results; and in an electronic device, providing multiple voice results. Provide user-specific acoustic models for initiation, and adjust user-specific acoustic models based on multiple voice inputs and multiple voice results.
【技术实现步骤摘要】
【国外来华专利技术】用户特定的声学模型优先权要求本专利申请要求于2017年5月12日提交的标题为“USER-SPECIFICACOUSTICMODELS”的美国临时专利申请62/505,680的优先权,该专利申请的内容全文以引用方式并入本文,以用于所有目的。本专利申请要求于2017年5月29日提交的标题为“USER-SPECIFICACOUSTICMODELS”的丹麦临时专利申请PA2017/70398的优先权,该专利申请的内容全文以引用方式并入本文,以用于所有目的。
本公开整体涉及声学模型,并且更具体地涉及适于一个或多个特定用户的声学模型。
技术介绍
声学模型可帮助电子设备解释语音输入,例如,在语音到文本系统的具体实施期间。举例而言,声学模型允许电子设备更好地解释语音的言语和韵律方面,诸如各种特定的字词和短语、口音、音调和节奏。然而,用于一般用途的声学模型的计算需求高并且施加大的存储器要求。因此,计算能力较低的设备通常不能实现此类声学模型。
技术实现思路
本文公开了示例性方法。一种示例性方法包括在具有一个或多个处理器的电子设备处接收多个语音输入,这些语音输入中的每个语音输入与电子设备的相同用户相关联;将多个语音输入中的每个语音输入提供给用户独立的声学模型,该用户独立的声学模型提供多个语音结果;在电子设备上发起用户特定的声学模型;以及基于多个语音输入和多个语音结果来调节用户特定的声学模型。本文公开了示例性非暂态计算机可读介质。公开了一种存储一个或多个程序的示例性非暂态计算机可读存储介质。一个或多个程序包括指令,该指令当由电子设备的一个或多个处理器执行时,使得电子设备接收多个语音输 ...
【技术保护点】
1.一种方法,包括:在具有一个或多个处理器的电子设备处;接收多个语音输入,所述语音输入中的每个语音输入与所述电子设备的相同用户相关联;将所述多个语音输入中的每个语音输入提供给用户独立的声学模型,所述用户独立的声学模型基于所述多个语音输入提供多个语音结果;在所述电子设备上发起用户特定的声学模型;以及基于所述多个语音输入和所述多个语音结果来调节所述用户特定的声学模型。
【技术特征摘要】
【国外来华专利技术】2017.05.29 DK PA201770398;2018.04.30 DK PA201870251.一种方法,包括:在具有一个或多个处理器的电子设备处;接收多个语音输入,所述语音输入中的每个语音输入与所述电子设备的相同用户相关联;将所述多个语音输入中的每个语音输入提供给用户独立的声学模型,所述用户独立的声学模型基于所述多个语音输入提供多个语音结果;在所述电子设备上发起用户特定的声学模型;以及基于所述多个语音输入和所述多个语音结果来调节所述用户特定的声学模型。2.根据权利要求1所述的方法,还包括:将所述用户特定的声学模型提供给另一个电子设备。3.根据权利要求2所述的方法,其中将所述用户特定的声学模型提供给另一个电子设备包括:确定所述用户特定的声学模型是否已在阈值数量的语音输入上进行训练;根据确定所述用户特定的声学模型已在阈值数量的语音输入上进行训练,将所述用户特定的声学模型提供给所述另一个电子设备;以及根据确定所述用户特定的声学模型未在阈值数量的语音输入上进行训练:基于第二多个语音输入和第二多个语音结果来调节所述用户特定的模型;以及将所述用户特定的声学模型提供给所述另一个电子设备。4.根据权利要求2至3中任一项所述的方法,其中:在所述另一个电子设备处:接收所述用户特定的声学模型;接收语音输入;以及利用所述用户特定的声学模型来识别所述语音输入的扬声器。5.根据权利要求4所述的方法,其中利用所述用户特定的声学模型来识别所述语音输入的扬声器包括:将所述语音输入提供给所述用户特定的声学模型,以提供第一语音结果和对应于所述语音结果的第一准确度得分;将所述语音输入提供给另一个用户特定的声学模型,以提供第二语音结果和对应于所述语音结果的第二准确度得分;以及基于所述第一准确度得分和所述第二准确度得分来识别所述语音输入的所述扬声器。6.根据权利要求4至6中任一项所述的方法,其中接收多个语音输入,所述语音输入中的每个语音输入与所述电子设备的相同用户相关联包括:从所述另一个电子设备接收所述多个语音输入中的一个或多个语音输入。7.根据权利要求1至6中任一项所述的方法,其中接收多个语音输入包括:在所述电子设备处接收所述多个语音输入中的一个或多个语音输入。8.根据权利要求7所述的方法,其中在所述电子设备处接收所述多个语音输入中的一个或多个语音输入包括:从对应于电话呼叫的用户话语获取所述多个语音输入中的所述一个或多个语音输入。9.根据权利要求7所述的方法,其中在所述电子设备处接收所述多个语音输入中的一个或多个语音输入包括:从对应于针对数字助理的请求的用户话语...
【专利技术属性】
技术研发人员:M·保力克,H·G·梅森,J·A·斯金德,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。