用于同步设备的机构、系统及方法技术方案

技术编号:11319183 阅读:68 留言:0更新日期:2015-04-22 08:44
本发明专利技术提供了一种用于同步与一个用户相关的多台设备中的多个动态语言模型的机构,各设备包括动态语言模型,所述机构用于:接收已由用户输入给一台或多台设备中的代表文本的文本数据;在所述文本数据上训练至少一个语言模型;以及提供至少一个所述语言模型以同步所述设备。本发明专利技术还提供了包含上述机构及多台设备的系统,以及用于同步存在于同一个用户相关的多台设备中的多个动态语言模型的方法。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于同步设备的机构以及同步设备的方法。
技术介绍
许多用户向多个设备中输入文本。举例来说,用户除了在平板电脑或个人电脑上书写电子邮件或文档之外,还会在移动电话上输入文本信息(短信/彩信)或电子邮件。上述各种设备均包括帮助用户完成文本输入的文本输入系统。文本输入系统可包括作为诸如用户书写风格等给定语言风格的概率封装的语言模型。基于语言模型的文本输入系统可通过一系列功能改善电子设备上的输入体验。举例来说,这些功能可以是基于语言来纠正键入错误输入/拼写错误输入,和/或预测出某一序列中可能将要使用的词条的功能。上述语言模型可以是基于用户向设备输入文本时的用户输入逐步受训的动态语言模型,这样其可使文本输入系统根据用户先前输入的文本纠正键入错误输入/拼写错误输入或预测出某一序列中可能出现的词条。本申请的专利技术人确定了拥有多台设备的用户所遇到的体验问题,各设备会随时间的变化不断学习用户的语言风格:由上述设备生成的预测会因使用而产生分歧。举例来说,同其它设备相比,用户更频繁使用其中的一台设备。同未被经常使用的设备相比,被频繁使用的装置将为用户生成更加准确的预测。这样既会使用户产生不适,又会为用户带来麻烦。本专利技术的目的在于克服上述问题。
技术实现思路
在本专利技术的一个方面中,提供了一种用于同步与一个用户相关的多台设备中的多个动态语言模型的机构,各设备包括动态语言模型。所述机构用于:接收代表已由用户输入给多台设备中的一台或多台设备的文本的文本数据;将文本数据合并入至少一个语言模型;以及提供至少一个所述语言模型以同步所述设备。文本数据可以是代表用户输入文本的任意数据。在第一实施例中,文本数据可包括由用户输入的实际文本。在这种情况下,将文本数据合并入语言模型的过程包括:在用户输入的文本上训练语言模型。在第二实施例中,文本数据可以是已在文本输入上受训的设备delta语言模型。在这种情况中,将文本数据合并入语言模型的过程包括:将设备delta语言模型合并入至少一个语言模型。这样,在本专利技术机构的第一实施例中,提供了一种用于同步与一个用户相关的多台设备中的多个动态语言模型的机构,各设备包括动态语言模型。所述机构用于:接收已由用户输入给多台设备中的一台或多台设备的文本;在该文本上训练至少一个语言模型;以及提供至少一个所述语言模型以同步所述设备。优选地,所述机构用于通过根据所述文本生成至少一个语言模型的方式或以所述文本训练至少一个现有语言模型的方式在所述文本上训练至少一个语言模型。所述文本包括输入至所述多台设备中的任意文本,而训练至少一个语言模型的过程优选包括:在所述文本上训练一个语言模型,以生成累积语言模型。所述文本包括自所述多个动态语言模型的先前同步以来被输入给所述多台设备中的任何一台的文本,而训练至少一个语言模型的过程包括:进一步在所述文本上训练所述累积语言模型。训练至少一个语言模型的过程包括:使用从除了与特定delta语言模型相关的该设备之外的所述多台设备中收到的文本为所述多台设备的每一台生成delta语言模型。所述机构优选在给定时间上与所述多台设备中的一台同步。所述机构用于验证用户。在本专利技术机构的第二实施例中,提供了一种用于同步与一个用户相关的多台设备中的多个动态语言模型的机构,各设备包括动态语言模型和在由用户输入给该设备的文本上受训的设备delta语言模型。所述机构用于:接收设备delta语言模型;将设备delta语言模型合并入至少一个语言模型;以及提供至少一个所述语言模型以同步所述多台设备。优选地,所述机构用于通过根据所述设备delta语言模型生成至少一个语言模型的方式或将所述设备delta语言模型与至少一个现有的语言模型合并在一起的方式,将所述设备delta语言模型合并入至少一个语言模型。将所述设备delta语言模型合并入至少一个语言模型的过程包括:将所述设备delta语言模型合并入一个语言模型,以生成累积语言模型。所述设备delta语言模型在自所述多个动态语言模型的先前同步以来被输入给所述多台设备之一的文本上受训。将所述设备delta语言模型合并入至少一个语言模型的过程包括:使用从除了与特定delta语言模型相关的设备之外的多台设备处收到的设备delta语言模型为所述多台设备的每一台生成delta语言模型。所述机构优选在给定时间上与所述多台设备中的一台同步。所述机构用于验证用户在本专利技术的第二方面中,提供了一种用于文本输入的系统。该系统包括:多台设备,每台设备均包括动态语言模型;以及前述任意一个实施例所述的机构。所述多台设备均用于将代表着被输入给设备的文本的文本数据传输给所述机构。在本专利技术系统的第一实施例中,代表着被输入给设备的文本的文本数据是被输入给该设备的实际文本。本系统的各设备用于接收累积语言模型,并在将被输入给该设备的文本传输至机构之前,将累积语言模型合并入其自身的动态语言模型。所述各设备接收与该设备相关的特定delta语言模型,并将所述delta语言模型合并入其自身的动态语言模型。所述各设备的各所述动态语言模型用于根据被输入给所述设备的文本生成至少一个文本预测,而且所述动态语言模型一旦被同步,在多个所述动态语言模型具有相同的文本输入时,多个所述动态语言模型可生成至少一个相同的文本预测。在上述系统的一个实施例中,所述机构包括服务器,而所述各设备从所述服务器处下载所述累积语言模型或delta语言模型,并将所述文本上传给所述服务器。所述系统包括所述服务器与所述各设备之间的安全连接装置。对于上述机构或系统而言,语言模型包括将词条序列与各序列的出现频率关联在一起的数据结构。所述设备通过以下方式将第一语言模型与第二语言模型合并:将所述第二语言模型数据结构内的序列出现频率与所述第一语言模型数据结构内的序列出现频率相加;以及如果新序列存在于所述第二语言模型的数据结构中,但未存在于所述第一语言模型的数据结构中,则将新序列及其对应的出现频率插入至所述第一语言模型的数据结构。如果一个或多个序列的出现频率在阈值以下,那么各设备还用于将一个或多个序列从已被合并的数据结构中删除。在本专利技术系统的第二个实施例中,代表着被输入给设备的文本的文本数据是已在被输入给该设备的文本上受训的delta语言模型。在这一实施例中,所述系统包括:多台设备,所述各设备均包括动态语言模型和在由用户输入给所述设备的文本上受训的设备delta语言模型;以及如任意一个前述实施例所述的机构。各所述设备用于向所述机构传输所述设备delta语言模型。所述各设备接收所述累积语言模型,并在向所述机构传输所述delta语言模型之前将所述累积语言模型合并入其自身的动态语言模型。所述各设备接收与该设备相关的特定delta语言模型,并将所述delta语言模型合并入其自身的动态语言模型。所述各设备的各动态语言模型用于根据被输入给所述设备的文本生成至少一个文本预测,其中,一旦完成同步,在所述动态语言模型获得相同的文本输入时,所述多个动态语言模型可生成至少一个相同的文本预测。在上述系统的一个实施例中,所述机构包括服务器,而所述各设备用于从所述服务器处下载累积语言模型或delta语言模型,并将设备delta语言模型上传至所述服务器。所述系统包括所述服务器与所述各设备本文档来自技高网...

【技术保护点】
一种用于同步与一个用户相关的多台设备中的多个动态语言模型的机构,各设备包括动态语言模型,所述机构被构建成:接收已由用户输入给多台设备中的一台或多台设备中的文本;在所述文本上训练至少一个语言模型;以及提供至少一个所述语言模型以同步所述多台设备。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:迈克尔·贝尔乔·弗里曼伊曼纽尔·乔治·哈特根本杰明·麦德洛克
申请(专利权)人:触摸式有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1