当前位置: 首页 > 专利查询>谷歌公司专利>正文

动态预测建模平台制造技术

技术编号:9548080 阅读:115 留言:0更新日期:2014-01-09 05:11
用于训练和再训练预测模型的方法、系统和装置,包括编码在一个或多个计算机存储设备上的计算机程序。例如通过网络从客户端计算系统接收属于客户端实体的训练数据集。将训练数据集与训练函数一起使用来生成经训练的预测模型。为经训练的预测模型中的每一个生成有效性分值。基于相应有效性分值从经训练的预测模型之中为客户端实体选择第一经训练的预测模型。向由客户端实体授权访问第一经训练的预测模型的用户提供对第一经训练的预测模型的访问。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】用于训练和再训练预测模型的方法、系统和装置,包括编码在一个或多个计算机存储设备上的计算机程序。例如通过网络从客户端计算系统接收属于客户端实体的训练数据集。将训练数据集与训练函数一起使用来生成经训练的预测模型。为经训练的预测模型中的每一个生成有效性分值。基于相应有效性分值从经训练的预测模型之中为客户端实体选择第一经训练的预测模型。向由客户端实体授权访问第一经训练的预测模型的用户提供对第一经训练的预测模型的访问。【专利说明】动态预测建模平台相关申请的交叉引用本申请要求于2011 年 I 月 26 日提交的题为 UPDATEABLE PREDICTIVE ANALYTICALMODELING的美国申请序列号N0.13/014, 223、以及于2011年I月26日提交的题为DYNAMICPREDICTIVE MODELING PLATFORM的美国申请序列号N0.13/014, 252的优先权,通过引用将其公开内容并入本文。
本说明书涉及训练以及再训练预测模型。
技术介绍
预测分析学一般是指用于从数据提取信息来构建能够从给定输入预测输出的模型的技术。预测输出可以包括预测未来的趋势或行为模式、或执行情感分析,仅列出一些示例。可以使用各种类型的预测模型来分析数据并且生成预测输出。典型地,用包括分别镜像将被输入到预测模型中的输入数据的形式和期望的预测输出的输入数据和输出数据的训练数据来训练预测模型。可能需要来训练预测模型的训练数据量会很大,例如大约十亿字节或兆兆字节。可用的不同类型的预测模型的数量是大量的,并且取决于输入数据的类型,不同的模型表现不同。另外,例如通过对超参数进行调整或通过特征归纳或选择,可以使特定类型的预测模型表现不同。
技术实现思路
总的来说,在一个方面中,在本说明书中所述的主题可以在包括一个或多个计算机和与该一个或多个计算机数据通信的一个或多个数据存储设备的计算机实现的系统中具体化。该一个或多个数据存储设备存储:训练数据储存库,其包括属于客户端实体并且通过网络从客户端计算系统接收的第一多个训练数据集;多个训练函数;以及指令,其当由该一个或多个计算机执行时,促使该一个或多个计算机执行操作。所述操作包括:使用多个训练函数和第一多个训练数据集来生成多个经训练的预测模型;为多个经训练的预测模型中的每一个生成相应有效性分值,其中每一个有效性分值表示其相应经训练的预测模型的有效性的估计;基于相应有效性分值从多个经训练的预测模型之中为客户端实体选择第一经训练的预测模型;以及向客户端实体授权访问第一经训练的预测模型的用户提供对第一经训练的预测模型的访问。本方面的其他实施例包括对应的方法和记录在计算机存储设备上的计算机程序,其每一个被配置成执行上述操作。这些和其他实施例每一个可以可选地单独或组合包括下面特征中的一个或多个。所述操作可以进一步包括:使用先前训练的可更新的预测模型、用来生成先前训练的可更新的预测模型的训练函数以及属于客户端实体的一个或多个新的训练数据集,来生成再训练的可更新的预测模型;为再训练的可更新的预测模型生成有效性分值;基于相应有效性分值从再训练的可更新的预测模型和多个经训练的预测模型之中为客户端实体选择第二经训练的预测模型;以及向客户端实体授权访问第二经训练的预测模型的用户提供对第二经训练的预测模型的访问。所述操作可以进一步包括在生成再训练的可更新的预测模型之前,确定下面条件中的至少一个为真:(i)在训练数据队列中的训练数据量大于或等于阈值量;(ii)达到或超过预先确定的时间量;或(iii)接收到更新先前训练的可更新的预测模型的请求。所述操作可以进一步包括:使用多个训练函数和属于客户端实体的第二多个训练数据集来生成多个新的经训练的预测模型;为多个新的经训练的预测模型中的每一个生成相应有效性分值;基于相应有效性分值从先前训练的预测模型和多个新的经训练的预测模型之中为客户端实体选择第二经训练的预测模型;以及向客户端实体授权访问第二经训练的预测模型的用户提供对第二经训练的预测模型的访问。所述操作可以进一步包括在生成多个新的经训练的预测模型之前,确定下面条件中的至少一个为真:(i)达到或超过预先确定的时间量接收到生成新的经训练的预测模型的请求。 第二多个训练数据集可以(i )包括一个或多个新的训练数据集和来自第一多个训练数据集的一个或多个训练数据集,或(ii )不包括被包括在第一多个训练数据集中的任何训练数据集。所述操作可以进一步包括从用户可操作的计算系统接收输入数据和对使用第一经训练的预测模型的预测输出的请求;使用输入数据和第一经训练的预测模型来生成预测输出;以及将预测输出提供给用户可操作的计算系统。生成多个经训练的预测模型可以包括将训练函数中的一个应用到训练数据集中的一个,来生成形成经训练的预测模型中的一个的参数集。所述操作可以进一步包括根据定义规则的数据保留策略来维护训练数据储存库,该规则确定哪些训练数据被保留以及哪些训练数据从储存库被删除。可以实现在本说明书中所述的主题的特定实施例,以实现下面优势中的一个或多个。可以对包括可更新的经训练的预测模型的经训练的预测模型的动态储存库进行维护。当新的训练数据变得可用时,可以动态更新可更新的经训练的预测模型。可以使用更新的训练数据集来再生成静态经训练的预测模型(即,不可更新的预测模型)。最有效的经训练的预测模型可以从动态储存库进行选择,并且用来响应于接收输入数据而提供预测输出。在动态储存库中的最有效的经训练的预测模型可以在新的训练数据变得可用并且用来更新储存库(即,更新和/或再生成经训练的预测模型)时,随着时间的推移而改变。可以提供服务,例如“在云中”,其中客户端计算系统可以提供输入数据和预测请求,并且作为响应接收预测输出,而不用耗费客户端计算资源或需要对预测分析建模的客户端专门知识。客户端计算系统可以增量地提供新的训练数据,并且基于客户端计算系统截至给定时间所提供的训练数据,被提供对在该给定时间可用的最有效的经训练的预测模型的访问。例如通过在检测到输出中的错误时提供正确输出作为更新训练样本,可以容易并迅速地校正给出错误的预测输出的可更新的经训练的预测模型。在附图和下面的描述中阐述了在本说明书中所述的主题的一个或多个实施例的细节。根据描述、附图和权利要求,所述主题的其他特征、方面和优势将变得显而易见。【专利附图】【附图说明】图1是提供预测分析平台的系统的示意表示。图2是示出用于通过网络提供预测分析平台的系统的示意框图。图3是示出用于从客户端计算系统的角度使用预测分析平台的示例过程的流程图。图4是示出用于使用预测分析平台来为客户端计算系统服务的示例过程的流程图。图5是示出用于从客户端计算系统的角度使用预测分析平台的示例过程的流程图。图6是示出用于使用预测分析平台来再训练可更新的经训练的预测模型的示例过程的流程图。图7是示出用于使用更新的训练数据来生成新的经训练的预测模型集的示例过程的流程图。图8是示出用于维护经训练的预测模型的更新的动态储存库的示例过程的流程图。在各附图中,相同的参考数字和标记指示相同的元素。【具体实施方式】描述了提供经训练的预测模型的动态储存库的方法和系统,所述经训练的预测模型中的至少部分可以在新的训练数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:乔丹·M·布雷肯里奇特拉维斯·H·K·格林罗伯特·卡普洛林伟豪吉迪恩·S·曼
申请(专利权)人:谷歌公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1