用于机器学习(ML)的自适应和上下文感知自动化服务组成的技术制造技术

技术编号:33763009 阅读:11 留言:0更新日期:2022-06-12 14:12
服务器系统可以接收识别数据的位置、描述对机器学习应用的预测的多个输入,以及用于机器学习应用的一个或多个约束。服务器系统可以访问包含数据的一个或多个本体的存储器。服务器系统可以提取数据集的一个或多个属性以根据所述一个或多个约束找到与对机器学习应用的预测相关的第一本体。服务器系统可以基于存储在存储器中的第一本体、所述一个或多个约束以及一个或多个先前的产品图来组成产品图,其中产品图将所述一个或多个数据对象与节点和边的集合关联,其中边表示包括数据结构的基本单元的节点之间的链接。单元的节点之间的链接。单元的节点之间的链接。

【技术实现步骤摘要】
【国外来华专利技术】用于机器学习(ML)的自适应和上下文感知自动化服务组成的技术
[0001]相关申请的交叉引用
[0002]本申请要求于2020年6月4日提交的标题为“TECHNIQUES FOR ADAPTIVE AND CONTEXT

AWARE AUTOMATED SERVICE COMPOSITION FOR MACHINE LEARNING(ML)”的美国非临时申请No.16/892,724的优先权,该申请通过引用整体并入本文并用于所有目的。本申请还要求于2020年6月4日提交的标题为“TECHNIQUES FOR ADAPTIVE PIPELINING COMPOSITION FOR MACHINE LEARNING(ML)”的美国非临时申请No.16/892,935的优先权,该申请通过引用整体并入本文并用于所有目的。本申请还要求于2020年9月12日提交的标题为“TECHNIQUES FOR SERVICE EXECUTION AND MONITORING FOR RUN

TIME SERVICE COMPOSITION”的美国非临时申请No.17/019,254的优先权,该申请通过引用整体并入本文并用于所有目的。本申请还要求于2019年9月14日提交的标题为“AUTOMATED MACHINE LEARNING SYSTEMS AND METHODS”的美国临时专利申请No.62/900,537的优先权,该申请通过引用整体并入本文并用于所有目的。


[0003]本公开涉及用于机器学习的系统和技术。更特别地,本公开涉及用于生成和管理机器学习应用的库的系统和技术

技术介绍

[0004]机器学习具有广泛的应用,诸如搜索引擎、医学诊断、文本和手写识别、图像处理和识别、负载预测、营销和销售诊断、聊天机器人、自主驾驶等。各种类型和版本的机器学习模型可以使用基于不同技术、语言、库等的训练数据为类似的应用生成,因此可能缺乏互操作性。此外,不同的模型在不同的上下文中和/或对于不同类型的输入数据可以具有不同的性能。数据科学家可能不具备生成构建自定义机器学习模型所必需的代码的编程技能。此外,可用的机器学习工具不将各种机器学习模型组件存储为库的一部分,以允许在其它机器学习模型中高效地重用例程。
[0005]现有的机器学习应用可以要求数据科学家的大量编程知识来设计和构造机器学习应用以解决特定问题。直观的界面可以帮助数据科学家通过一系列查询来构造机器学习应用。
[0006]一些组织可以用可定制的模式存储来自多个客户端或供应商的数据。这些可定制的模式可能与现有机器学习模型使用的标准化数据存储模式不匹配。因此,这些其它系统将需要在使用存储的数据之前执行协调过程。协调过程可以是或者手动过程,或者可以在使用数据生成机器学习应用之前通过繁琐的提取、变换、加载自动化过程。
[0007]仅基于度量(例如,服务质量(QoS)或关键性能指标)的机器学习应用可能不足以组成具有最小人工干预的用于自适应体系架构的流水线。预先存在的机器学习工具不会组合基于非逻辑和基于逻辑的语义服务来生成机器学习应用。
[0008]现有的机器学习工具趋于最大化来自相同源的新数据的分类准确度。在这样做的过程中,这些现有框架试图基于模型性能组成最佳流水线。但是,模型性能本身并不覆盖由于在线数据度量的变化或QoS违反而必须在运行时适配流水线的情况。

技术实现思路

[0009]本公开的某些方面和特征涉及生成组件的库以生成机器学习模型和机器学习应用的机器学习平台。机器学习基础设施系统允许用户(即,数据科学家)生成机器学习应用,而无需详细了解基于云的网络基础设施或了解如何生成用于构建模型的代码。机器学习平台可以分析识别出的数据和用户提供的期望的预测和性能特点以选择一个或多个库组件和关联的API来生成机器学习应用。机器学习技术可以监视和评估机器学习模型的输出以允许对模型进行反馈和调整。可以训练、测试和编译机器学习应用,以作为独立的可执行代码导出。
[0010]机器学习平台可以生成和存储可以被用于其它机器学习应用的一个或多个库组件。机器学习平台可以允许用户生成简档,该简档允许平台基于用户的历史偏好进行推荐。模型创建引擎可以检测在期望性能准则内实现期望结果所必需的基础设施资源的数量和类型。
[0011]聊天机器人可以提供直观的界面以允许数据科学家在没有大量编程经验的情况下生成机器学习应用。聊天机器人能够使用交谈界面将自然语言翻译成机器学习解决方案的结构化表示。聊天机器人可以被用于指示数据的位置、选择机器学习解决方案的类型、显示最能满足约束的最优解决方案,并推荐部署该解决方案的最佳环境。
[0012]自调整公司范围的发现和集成特征可以审查客户端的数据存储库,审查用于各种数据模式的标签,并将客户端的数据模式有效地映射到由机器学习模型使用的分类。各种技术可以自动选择对每个个体用例(即,一个客户端)具有预测性的特征,从而有效地使机器学习解决方案与应用开发人员无关。可以生成和存储特定机器学习解决方案的每个特征的共用表示的加权列表。当新数据添加到数据存储库时,匹配服务可以至少部分基于加权列表自动检测应当将哪些特征馈入机器学习解决方案。当使得新数据可用于模型时,可以更新加权列表。
[0013]现有数据本体可以被用于生成机器学习解决方案,以对相关服务进行高精度搜索,从而以最少的人工干预组成流水线。数据本体可以被用于创建基于非逻辑和基于逻辑的语义服务的组合,在精度方面可以显著优于这两种选择。QoS和产品KPI约束可以被用作体系架构选择的一部分。对于没有现有本体的数据集,生成一个或多个本体。
[0014]所提出的系统可以在构造时使用最佳可用模型来使用机器学习应用来解决问题。自适应流水线化组成服务可以识别一个或多个新模型并将其结合到机器学习应用中。可以离线测试具有新模型的机器学习应用,并将结果与基本事实数据进行比较。如果具有新模型的机器学习应用的性能优于先前使用的模型,那么机器学习应用可以被升级并自动晋级到生产。还可以发现一个或多个参数。新参数可以在离线模式下结合到现有模型中。可以离线测试具有新参数的机器学习应用,并可以将结果与用现有参数的先前结果进行比较。如果与基本事实数据相比,新参数的性能优于现有参数,那么机器学习应用可以自动晋级到生产。
[0015]根据一些实施方式,一种方法可以包括接收第一输入,其中第一输入识别数据的位置;接收第二输入,其中第二输入描述用于机器学习应用的预测;接收第三输入,其中第三输入包括用于机器学习应用的一个或多个约束;访问包含数据的一个或多个本体的存储器,其中每个本体描述用于一个或多个数据对象的一个或多个数据集的层次结构,其中每个数据对象表现出允许根据规则将数据对象分类为一个或多个数据对象集合的一个或多个属性;根据一个或多个约束,提取一个或多个数据集的一个或多个属性以找到与用于机器学习应用的预测相关的第一本体;基于存储在存储器中的第一本体、一个或多个约束和一个或多个先前的产品图来组成产本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于自动创建为硬件平台定制的机器学习应用以用在生产环境中的方法,所述方法包括:接收第一输入,其中第一输入识别数据的位置;接收第二输入,其中第二输入描述用于机器学习应用的预测;接收第三输入,其中第三输入包括用于机器学习应用的一个或多个约束;访问包含数据的一个或多个本体的存储器,其中每个本体描述用于一个或多个数据对象的一个或多个数据集的层次结构,其中每个数据对象表现出允许根据规则将数据对象分类为一个或多个数据对象集合的一个或多个属性;根据所述一个或多个约束,提取所述一个或多个数据集的一个或多个属性以找到与用于机器学习应用的预测相关的第一本体;基于存储在存储器中的第一本体、所述一个或多个约束和一个或多个先前的产品图来组成产品图,其中所述产品图将所述一个或多个数据对象与节点和边的集合相关,其中边表示节点之间的链接;其中节点包括数据结构的基本单元;以及将产品图存储在存储器中。2.如权利要求1所述的方法,还包括:至少部分地基于分析所述一个或多个数据对象的属性生成本体,其中所述一个或多个属性包括:每个服务的一个或多个功能语义,所述一个或多个功能语义包括特征选择、离群值检测和可解释性度量中的至少一个;一个或多个前提条件和一个或多个效果,其中前提条件是执行服务之前存在的条件并且所述一个或多个效果是执行服务之后存在的条件;一个或多个参数,其中所述一个或多个参数与服务的出处有关;一个或多个度量,其中所述一个或多个度量包括服务质量度量;以及一个或多个指标,其中所述一个或多个指标包括关键性能指标;以及将本体存储在存储器中。3.如权利要求2所述的方法,其中服务质量度量包括时延度量、响应时间度量、吞吐量度量、可靠性度量、可用性度量、成功率度量和隐私度量中的至少一个。4.如权利要求1所述的方法,还包括:从所述一个或多个本体生成服务元数据,其中服务元数据至少部分地基于运行时期望从机器学习的角度描述所述一个或多个本体的一个或多个概念;以及将服务元数据保存到存储器。5.如权利要求1所述的方法,还包括:至少部分地基于来自所述一个或多个先前的产品图的一个或多个描述符来搜索一个或多个服务;将所述一个或多个描述符与机器学习应用的预测相关;至少部分地基于所述相关来生成可用服务的列表;以及将可用服务的列表保存在存储器中。6.如权利要求5所述的方法,其中所述搜索使用元启发式方法来确定解决方案。7.如权利要求1所述的方法,还包括:
在显示器上呈现产品图,产品图包括产品图的性能的一个或多个度量;确定折衷的集合,其中折衷的集合包括鉴于机器学习应用的预测对所述一个或多个约束的选择;以及在显示器上呈现折衷的集合。8.一种有形地实施在非暂态机器可读存储介质中的计算机程序产品,包括被配置为使数据处理装置执行用于自动创建机器学习应用以用在生产环境中的操作的指令,所述操作包括:接收第一输入,其中第一输入识别数据的位置;接收第二输入,其中第二输入描述用于机器学习应用的预测;接收第三输入,其中第三输入包括用于机器学习应用的一个或多个约束;访问包含数据的一个或多个本体的存储器,其中每个本体描述一个或多个数据对象的一个或多个数据集,其中每个数据对象表现出允许根据规则将数据对象分类为一个或多个数据对象集合的一个或多个属性;根据所述一个或多个约束,提取所述一个或多个数据集的一个或多个属性以找到与用于机器学习应用的预测相关的第一本体;基于存储在存储器中的第一本体、所述一个或多个约束和一个或多个先前的产品图来组成产品图,其中产品图将所述一个或多个数据对象与节点和边的集合相关,其中边表示节点之间的链接;其中节点包括数据结构的基本单元;以及将产品图存储在存储器中。9.如权利要求8所述的计算机程序产品,包括被配置为使数据处理装置执行另外的操作的指令,所述操作包括:至少部分地基于分析所述一个或多个数据对象的属性生成本体,其中所述一个或多个属性包括:每个服务的一个或多个功能语义,所述一个或多个功能语义包括特征选择、离群值检测和可解释性度量中的至少一个;一个或多个前提条件和一个或多个效果,其中前提条件是执行服务之前存在的条件并且所述一个或多个效果是执行服务之后存在的条件;一个或多个参数,其中所述一个或多个参数与服务的出处有关;一个或多个度量,其中所述一个或多个度量包括服务质量度量;以及一个或多个指标,其中所述一个或多个指标包括关键性能指标;以及将本体存储在存储器中。10.如权利要求9所述的计算机程序产品,其中服务质量度量包括时延度量、响应时间度量、吞吐量度量、可靠性度量、可用性度量、成功率度量和隐私度量中的至少一个。11.如权利要求...

【专利技术属性】
技术研发人员:A
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1