当前位置: 首页 > 专利查询>罗伯特专利>正文

用于为机器学习系统生成训练数据的设备和方法技术方案

技术编号:37059330 阅读:31 留言:0更新日期:2023-03-29 19:36
提供了用于为机器学习系统生成训练数据的设备和方法。用于训练第一机器学习系统的计算机实现的方法,其中第一机器学习系统被配置为生成表征图像的标签图的输出,其中所述方法包括以下步骤:提供第一输入和第二输入,其中第一输入表征二进制向量,所述二进制向量表征来自多个类的类的相应存在或不存在,并且其中第二输入表征随机抽取的值;由第一机器学习系统的第一生成器基于第一输入和第二输入确定输出,其中输出表征第一标签图,其中第一标签图表征针对来自所述多个类的类的概率;借助于全局汇集操作确定第一标签图的表示;基于损失函数训练第一机器学习系统,其中损失函数表征F1损失,其中F1损失表征第一输入和第一标签图的表示之间的差异。的表示之间的差异。的表示之间的差异。

【技术实现步骤摘要】
用于为机器学习系统生成训练数据的设备和方法


[0001]本专利技术涉及用于训练机器学习系统的方法、用于使用机器学习系统确定数据集的方法、用于使用数据集训练第二机器学习系统的方法、机器学习系统、计算机程序和机器可读存储设备。
现有技术
[0002]Le Moing等人的“Semantic Palette: Guiding Scene Generation with Class Proportions”(2021年6月3日https://arxiv.org/pdf/2106.01629.pdf)公开了一种用于训练机器学习系统以生成标签图和图像的方法。

技术介绍

[0003]机器学习系统越来越多地用在几乎所有的
中。通常,这些统计模型是用于多种应用的使能技术,所述多种应用例如是诸如汽车、无人机或船只之类的自主交通工具。
[0004]机器学习系统的性能——即其准确地预测所提供数据(例如图像)的期望结果(例如期望分类)的能力——关键取决于已训练机器学习系统所用的数据。例如,如果用于对交通工具附近的对象进行分类的机器学习系统没本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于训练第一机器学习系统(70)的计算机实现的方法,其中第一机器学习系统(70)被配置为生成表征图像的标签图的输出(x
f
),其中所述方法包括以下步骤:
•ꢀ
提供第一输入(y)和第二输入(n),其中第一输入(y)表征二进制向量,所述二进制向量表征来自多个类的类的相应存在或不存在,并且其中第二输入(n)表征随机抽取的值;
•ꢀ
由第一机器学习系统(70)的第一生成器(71)基于第一输入(y)和第二输入(n)确定输出(x
f
),其中输出(x
f
)表征第一标签图,其中第一标签图表征针对来自所述多个类的类的概率;
•ꢀ
借助于全局汇集操作(73)确定第一标签图的表示();
•ꢀ
基于损失函数()训练第一机器学习系统(70),其中损失函数()表征F1损失(),其中F1损失()表征第一输入(y)和第一标签图的表示()之间的差异。2.根据权利要求1所述的方法,其中,F1损失()是宏F1损失,优选地是双面宏软F1损失。3.根据权利要求1或2所述的方法,其中,基于第一机器学习系统(70)的训练数据集的标签图,确定第一输入(y)中的来自所述多个类的类的存在或不存在。4.根据权利要求3所述的方法,其中,基于多个第一输入来训练第一机器学习系统(70),其中针对来自所述多个第一输入的每个第一输入(y)实行所述步骤,并且其中所述多个第一输入包括表征类的存在和不存在的组合的第一输入,其在训练数据集的标签图中没有观察到或者在训练数据集中罕见观察到。5.根据权利要求1至4中任一项所述的方法,其中,第一生成器(71)是包括在第一机器学习系统(70)中的条件GAN的一部分,其中第一生成器(71)基于条件GAN损失()和F1损失()来训练。6.根据前述权利要求中任一项所述的方法,其中,第一机器学习系统(70)进一步包括第二生成器,其中,第二生成器被配置用于基于从第一生成...

【专利技术属性】
技术研发人员:A
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1