用于语言模型个性化的系统和方法技术方案

技术编号:26045294 阅读:58 留言:0更新日期:2020-10-23 21:25
提供了一种方法、电子设备和计算机可读介质。该方法包括识别与一个或多个用户相关联的可观察特征集合。该方法还包括根据可观察特征集合生成潜在特征。该方法还包括将潜在特征分类为一个或多个集群。该一个或多个集群的每个集群表示共享一部分潜在特征的用户组的言语表达。该方法还包括生成与一个或多个集群中的特定集群相对应的语言模型。语言模型表示与特定集群的用户组相关联的言语表达的概率排序。

【技术实现步骤摘要】
【国外来华专利技术】用于语言模型个性化的系统和方法
本公开总体上涉及电子设备。更具体地,本公开涉及生成用于自动语音识别的个性化语言模型。
技术介绍
与计算设备进行交互并且控制计算设备的方法在不断改进,以便符合更自然的方法。用于与计算设备进行交互并且控制计算设备的许多此类方法通常要求用户利用诸如键盘、鼠标之类的用户界面工具,或者如果屏幕是触摸屏,则用户可以物理地触摸屏幕本身以提供输入。某些电子设备采用语音使能的用户界面来使用户能够与计算设备进行交互。使用自然语言正成为人们所选择的与某些电子设备和器具进行交互的方法。从自然语言到预期交互的平稳过渡可以在消费者满意度方面发挥越来越重要的作用。
技术实现思路
技术问题某些电子设备采用语音使能的用户界面来使用户能够与计算设备进行交互。使用自然语言正成为人们所选择的与某些电子设备和器具进行交互的方法。从自然语言到预期交互的平稳过渡可以在消费者满意度方面发挥越来越重要的作用。本公开提供了一种用于使自动语音识别情境化的系统和方法。技术方案在一个实施例中,提供了一种方法。该方法包括识别与一个或多个用户相关联的第一信息(例如,可观察特征集合)。该方法还包括根据该可观察特征集合获得(生成)第二信息(例如,潜在特征集合)。该方法还包括通过将潜在特征分类为一个或多个集群来获得该一个或多个集群,该一个或多个集群的每个集群表示共享一部分所述潜在特征的用户组的言语表达。该方法还包括生成(获得)与该一个或多个集群的特定集群相对应的语言模型。语言模型表示与特定集群的用户组相关联的言语表达的概率排序。在另一实施例中,提供了一种电子设备。该电子设备包括处理器。该处理器被配置为识别与一个或多个用户相关联的第一信息(例如,可观察特征集合)。处理器还被配置为根据该可观察特征集合生成(获得)第二信息(例如,潜在特征集合)。处理器还被配置为通过将潜在特征分类为一个或多个集群来获得该一个或多个集群,该一个或多个集群的每个集群表示共享一部分所述潜在特征的用户组的言语表达。处理器还被配置为生成(获得)与该一个或多个集群的特定集群相对应的语言模型。语言模型表示与该特定集群的用户组相关联的言语表达的概率排序。在另一实施例中,提供了一种体现计算机程序的非暂时性计算机可读介质。该计算机程序包括计算机可读程序代码,该计算机可读程序代码在由电子设备的处理器执行时使该处理器:识别与一个或多个用户相关联的第一信息(例如,可观察特征集合);根据该可观察特征集合生成(获得)第二信息(例如,潜在特征集合);通过将潜在特征分类为一个或多个集群来获得该一个或多个集群,该一个或多个集群的每个集群表示共享一部分所述潜在特征的用户组的言语表达;并且生成(获得)与该一个或多个集群的特定集群相对应的语言模型,语言模型表示与该特定集群的用户组相关联的言语表达的概率排序。根据以下附图、说明书和权利要求书,其他技术特征对于本领域技术人员而言可以是显而易见的。在进行下面的具体实施方式之前,阐明在本专利文件全文中使用的某些字词和短语的定义可能是有利的。术语“耦合”及其派生词是指两个或更多个元件之间的任何直接或间接的通信,无论这些元件是否彼此物理地接触。术语“发送”、“接收”和“通信”及其派生词涵盖直接和间接的通信。术语“包括”和“包含”及其派生词是指包括但不限于。术语“或”是包含性的,意指和/或。短语“与……相关联”及其派生词意指包括、被包括在内、与……互连、包含、被包含在内、连接到……或与……连接、耦合到……或与……耦合、与……可通信、与……协作、交错、并置、与……接近、结合到……或与……结合、具有、具有……的属性、关系到……或与……有关系等。术语“控制器”是指控制至少一个操作的任何设备、系统或其一部分。这样的控制器可以以硬件或硬件和软件和/或固件的组合来实现。无论是本地的还是远程的,与任何特定控制器相关联的功能都可以是集中式或分布式的。当与项目的列表一起使用时,短语“至少一个”意指可以使用一个或多个所列项目的不同组合,并且可以只需要列表中的一个项目。例如,“A、B和C中的至少一个”包括以下组合的任何一种:A;B;C;A和B;A和C;B和C及A和B和C。此外,以下描述的各种功能可以由一个或多个计算机程序实现或支持,每个计算机程序由计算机可读程序代码形成并且体现在计算机可读介质中。术语“应用程序”和“程序”是指适于以合适的计算机可读程序代码实现的一个或多个计算机程序、软件组件、指令集、过程、功能、对象、类、实例、相关数据或其一部分。短语“计算机可读程序代码”包括任何类型的计算机代码,包括源代码、目标代码和可执行代码。短语“计算机可读介质”包括能够由计算机访问的任何类型的介质,例如只读存储器(ROM)、随机存取存储器(RAM)、硬盘驱动器、光盘(CD)、数字视频光盘(DVD)或任何其他类型的存储器。“非暂时性”计算机可读介质不包括传输暂时性电信号或其他信号的有线、无线、光学或其他通信链路。非暂时性计算机可读介质包括可以永久存储数据的介质以及可以存储数据并且随后覆盖数据的介质,例如可重写光盘或可擦除存储器件。在本专利文件全文中还提供其他某些字词和短语的定义。本领域普通技术人员应理解,在很多情况下,即使不是大多数情况,这样的定义也适用于这些被定义的字词和短语的先前和将来的使用。本专利技术的有利效果通过参考下面的说明书、所附权利要求和附图,将理解一个或多个实施例的这些和其他特征、方面和优点。附图说明为了更完整地理解本公开及其优点,现在参考以下结合附图所进行的描述,其中相同的附图标记表示相同的部件:图1示出了根据本公开的实施例的示例通信系统;图2示出了根据本公开的一个实施例的示例电子设备;图3示出了根据本公开的一个实施例的示例电子设备;图4a和图4b示出了根据本公开的一个实施例的自动语音识别系统;图4c示出了根据本公开的一个实施例的示例环境架构的框图;图5a、图5b和图5c示出了根据本公开的一个实施例的示例自动编码器;图6a示出了根据本公开的一个实施例的用于创建多个个性化语言模型的示例过程;图6b示出了根据本公开的一个实施例的示例集群;图7示出了根据本公开的一个实施例的用于为新用户创建个性化语言模型的示例过程;以及图8示出了根据本公开的一个实施例的基于情境信息确定要执行的操作的示例方法。具体实施方式本专利文件中在下面讨论的图1至图8以及用于描述本公开的原理的各种实施例仅作为示例说明,并且不应以任何方式解释为限制本公开的范围。本领域技术人员将理解,本公开的原理可以在任何适当布置的系统或设备中实现。根据本公开的实施例,提供了用于控制计算设备并与计算设备进行交互的各种方法。图形用户界面通过使用户能够定位和选择屏幕上的对象而允许与电子设备(例如,计算设备)进行用户交互。常见的交互包括物理操控,例如用户物理地移动鼠标、在键盘上打字、触摸触敏表面的触摸屏等。在某些情况下,利用诸如触摸触摸屏之类的各本文档来自技高网...

【技术保护点】
1.一种方法,包括:/n识别与一个或多个用户相关联的第一信息;/n通过基于与所述一个或多个用户相关联的情境信息减少所述第一信息的量而获得第二信息;/n基于所述第二信息获得一个或多个集群,所述一个或多个集群中的每个集群表示共享一部分所述第二信息的用户组的言语表达;以及/n获得与所述一个或多个集群中的集群相对应的语言模型,所述语言模型表示与所述集群的所述用户组相关联的所述言语表达的概率排序。/n

【技术特征摘要】
【国外来华专利技术】20180306 US 62/639,114;20181220 US 16/227,2091.一种方法,包括:
识别与一个或多个用户相关联的第一信息;
通过基于与所述一个或多个用户相关联的情境信息减少所述第一信息的量而获得第二信息;
基于所述第二信息获得一个或多个集群,所述一个或多个集群中的每个集群表示共享一部分所述第二信息的用户组的言语表达;以及
获得与所述一个或多个集群中的集群相对应的语言模型,所述语言模型表示与所述集群的所述用户组相关联的所述言语表达的概率排序。


2.根据权利要求1所述的方法,其中,所述第一信息包括与一个或多个用户相关联的可观察特征集合,并且所述第二信息包括从所述可观察特征集合中获得的潜在特征。


3.根据权利要求2所述的方法,其中,获得所述潜在特征包括:
基于所述可观察特征集合获得多维向量,所述多维向量的每个维度对应于所述可观察特征集合中的一个特征;以及
减少所述多维向量的维度的量以导出所述潜在特征。


4.根据权利要求3所述的方法,其中,使用自动编码过程来减少所述多维向量的维度的量。


5.根据权利要求2所述的方法,还包括:
获得第一语言模型和第二语言模型,至少所述第一语言模型和所述第二语言模型中的每个语言模型分别对应于所述一个或多个集群中的一集群;并且
获得所述第一语言模型和所述第二语言模型包括:
识别所述一个或多个集群中的每个集群的质心;
基于与所述一个或多个集群中的一个集群相关联的第一用户组的言语表达构建第一数据库;
基于与所述一个或多个集群中的另一集群相关联的第二用户组的言语表达构建第二数据库;以及
在构建所述第一数据库和所述第二数据库之后,基于所述第一数据库获得所述第一语言模型并基于所述第二数据库获得所述第二语言模型。


6.根据权利要求2所述的方法,其中,所述可观察特征集合包括至少一个典型特征和至少一个增强特征。


7.根据权利要求2所述的方法,还包括:
获得一个或多个语言模型,所述一个或多个语言模型中的每个语言模型对应于表示所述言语表达的所述一个或多个集群中的一个集群,并且
其中,所述方法还包括:
获得与新用户相关联的一个或多个可观察特征;
基于与所述新用户相关联的所述一个或多个可观察特征识别所述新用户的一个或多个潜在特征;
识别所述新用户的所述一个或多个潜在特征与分类后的潜在特征之间的相似性程度;以及
获得针对所述新用户的个性化加权语言模型,所述个性化加权语言模型基于所述新用户的所述一个或多个潜在特征与表示共享一部分所述潜在特征的用户组的言语表达的所述一个或多个集群之间的相似性程度。


8.根据权利要求7所述的方法,还包括:
获得多个语言模型,并且
所述方法还包括:
识别低于所述新用户的所述一个或多个潜在特征和与所述一个或多个集群的子集相关联的所述潜在特征之间的相似性阈值的一个集群;以及
当生成针对所述新用户的所述个性化加权语言模型时,排除所述多个语言模型中的与低于...

【专利技术属性】
技术研发人员:阿尼尔·亚达夫阿卜杜勒·劳福·哈利达阿里雷扎·迪拉夫佐恩穆罕默德·梅迪·穆阿兹米宋璞周政
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1