嵌入式预测机器学习模型制造技术

技术编号：22693716 阅读：20 留言：0更新日期：2019-11-30 06:19

与一个或多个数据源相关联的数据通过使用一个或多个变换器而被变换成与公共本体相关联的格式。至少部分地基于经变换的数据来生成一个或多个机器学习模型。所述一个或多个机器学习模型和所述一个或多个变换器被提供到远程设备。

Embedded predictive machine learning model

Data associated with one or more data sources is transformed into a format associated with a common ontology by using one or more converters. At least in part, one or more machine learning models are generated based on transformed data. One or more machine learning models and one or more converters are provided to a remote device.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】嵌入式预测机器学习模型其他申请的交叉引用本申请对2017年3月31日提交的、题为EMBEDDEDPREDICTIVEMACHINELEARNINGMODELS的、申请号为62/479,968的美国临时专利申请要求优先权，所述美国临时专利申请通过引用被并入本文中用于所有目的。本专利技术的背景与实体（例如个体、企业、设备、机器等等）相关联的信息可以跨多个数据库被存储。用来将与实体相关联的信息存储在第一数据库、即本体中的方式可能不一定与用来将信息存储在一个或多个其他数据库中的方式相同。例如，一个数据库可以通过个体的社保号来标识个体，而第二数据库可以通过个体的驾驶执照号来标识相同的个体。另一数据库可以将个体的生日标识为2000年1月1日，而另一数据库可以将个体的生日标识为01/01/00。作为结果，这些不一致性使得难以将来自多个数据库的与实体相关联的信息组合到单个数据库中。机器学习是计算机科学的领域，其给予计算机在没有被显式编程的情况下学习的能力。计算机可以包括机器学习模型，所述机器学习模型能够被训练以实现复杂的函数，所述复杂的函数被配置成基于输入集合来生成一个或多个预测。经训练的机器学习模型被配置成像黑盒一样起作用：它接收生产数据，所述生产数据被应用到所述复杂函数，并且输出一个或多个预测标签。然而，经训练的机器学习模型的准确性受用于训练机器学习模型的数据所限制。当用于训练机器学习模型的数据利用不同的本体而跨多个数据库被存储的时候，训练机器学习模型来输出准确的预测标签可能是困难的。附图说明在以下...

【技术保护点】
1.一种方法，包括：/n通过使用一个或多个变换器将与一个或多个数据源相关联的数据变换成与公共本体相关联的格式；/n至少部分地基于经变换的数据来生成一个或多个机器学习模型；以及/n向远程设备提供所述一个或多个机器学习模型和所述一个或多个变换器。/n

【技术特征摘要】
【国外来华专利技术】20170331 US 62/479968;20180329 US 15/9396521.一种方法，包括：
通过使用一个或多个变换器将与一个或多个数据源相关联的数据变换成与公共本体相关联的格式；
至少部分地基于经变换的数据来生成一个或多个机器学习模型；以及
向远程设备提供所述一个或多个机器学习模型和所述一个或多个变换器。

2.根据权利要求1所述的方法，此外包括从一个或多个数据库接收与一个或多个数据源相关联的数据。

3.根据权利要求1所述的方法，其中所述一个或多个数据库通过使用对应的本体来存储数据。

4.根据权利要求1所述的方法，其中所述一个或多个数据库中至少一个的对应本体不同于公共本体。

5.根据权利要求1所述的方法，此外包括基于所述经变换的数据来生成一个或多个新特征。

6.根据权利要求5所述的方法，其中至少部分地基于所述一个或多个新特征来训练所述一个或多个机器学习模型。

7.根据权利要求1所述的方法，其中通过使用以下各项中的至少一个来变换数据：滤波器变换器、频率变换器、批量交互变换器、被截断的SVD数值变换器、交叉验证目标编码、交叉验证分类至数值编码变换器、日期变换器、日期极变换器、文本变换器、分类目标编码变换器、数值至分类目标编码变换器、聚类目标编码变换器、聚类距离变换器、证据权重、和/或数值至分类证据权重变换器。

8.根据权利要求1所述的方法，其中所述远程设备被配置成通过使用所述一个或多个变换器来将生产数据变换成公共本体。

9.根据权利要求8所述的方法，其中所述远程设备被配置成通过使用所述一个或多个机器学习模型和经变换的生产数据来做出一个或多个预测。

10.根据权利要求8的方法，其中为了通过使用所述一个或多个变换器来将生产数据变换成公共本体，所述远程设备此外被配置成：
分析与生产数据相关联的特征以及对应的特征值；
确定...

【专利技术属性】
技术研发人员：S安巴蒂，T克拉尔杰维奇，P斯特岑克，S乔希，
申请(专利权)人：H二O人工智能公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人