数据集空间中的梯度流制造技术

技术编号:38465837 阅读:27 留言:0更新日期:2023-08-11 14:42
总体上,在此讨论的是通过使数据集朝向目标数据集流动而用于机器学习(ML)的设备、系统和方法。一种方法可以包括:接收对包括第一特征标签配对的第一数据集操作的请求,从多个数据集标识第二数据集,第二数据集包括第二特征标签配对,确定第一特征标签配对和第二特征标签配对之间的距离,以及使用基于所确定的距离操作的数据集目标来使第一数据集流动,以生成经优化的数据集。经优化的数据集。经优化的数据集。

【技术实现步骤摘要】
【国外来华专利技术】数据集空间中的梯度流

技术介绍

[0001]机器学习(ML)的当前实践是以模型为中心的。当前的实践在假设数据要么是固定的,要么是受制于外在的和不可避免的变化的同时将问题归结为对模型参数的调整。这种实践未能捕捉到ML的重要现有方面,诸如数据操作(例如,增强),而这些操作涉及到通常的ML设计、训练和操作。此外,这种实践不适合将新的以数据为中心的问题(诸如模型不可知的迁移学习或数据集合成)形式化。

技术实现思路

[0002]提供该概要部分是为了以简化的形式介绍实施例的各方面,在详细描述中对以下实施例进一步解释。本概要部分不旨在标识所要求保护的主题的基本或所需特征,并且本概要部分中列出的元素的组合和顺序不旨在对所要求保护主题的元素提供限制。
[0003]实施例可以以不同于传统ML范式的方式执行机器学习(ML)的操作。实施例可以基于指定目标使第一数据集朝向第二数据集流动。实施例可以允许修改(“流动”)数据集以满足目标,而不是修改模型参数以满足目标。
[0004]方法、系统、计算机可读介质、设备等可以被配置为实现一个或多个实施例。使数据集朝向目标数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于通过使数据集朝向目标数据集流动来机器学习(ML)的计算机实现的方法,所述方法包括:接收对包括第一特征标签配对的第一数据集操作的请求;标识或接收第二数据集,所述第二数据集包括第二特征标签配对;确定所述第一特征标签配对和所述第二特征标签配对之间的距离;以及使用基于所确定的所述距离操作的数据集目标来使所述第一数据集流动,以生成经优化的数据集。2.根据权利要求1所述的计算机实现的方法,其中每个标签由在所述距离确定中映射到所述标签的特征的概率分布表示。3.根据权利要求1所述的计算机实现的方法,还包括:以经改变的所述第一数据集作为输入来操作在所述第二数据集上训练的第一ML模型,以提供结果。4.根据权利要求1所述的计算机实现的方法,还包括:使用所述第二数据集的至少一部分和经改变的所述第一数据集来训练第二ML模型。5.根据权利要求1所述的计算机实现的方法,还包括:提供经改变的所述第一数据集。6.根据权利要求3所述的计算机实现的方法,还包括:在训练期间保持所述第一ML模型静态。7.根据权利要求1所述的计算机实现的方法,其中确定所述距离包括确定可微分距离。8.根据权利要求7所述的计算机实现的方法,其中所述距离包括最优运输距离(OTD)。9.根据权利要求8所述的...

【专利技术属性】
技术研发人员:D
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1