【技术实现步骤摘要】
用于机器学习模块的难度适应训练
[0001]本专利技术涉及出于这样的分类其特别适合于具有高度可变的不确定性的安全关键应用的目的的机器学习模块的训练。
技术介绍
[0002]为了许多安全关键任务的自动化,诸如在道路交通中车辆的至少部分自动化驾驶,设想了使用可训练的机器学习模块。例如,这样的模块可以从车辆周围的环境中获取物理测量数据,并且给对象分类,该对象诸如是道路标记、道路标志、行人或其他车辆。使用这样的模块的附带好处是,基于对有限数量情况的训练,即使在不是训练的一部分的情况下,也可以合理预期车辆正确运转。从这个意义上讲,可以将训练过程视为类似于针对人类驾驶员的训练过程。人类驾驶员在训练过程期间只花了几十个小时在驾驶,但是然后就预期操控在一生中可能出现的任何意外情况。
[0003]对于这个和其他安全关键应用,知晓机器学习模块的输出的不确定性是至关重要的。例如,这样的不确定性可能是由物理测量数据的差的质量(诸如差的能见度条件),由在某些情况下(诸如,被卡车部分遮挡的汽车)识别某些对象的固有困难、或甚至由故意利用“对抗”模式操纵道路标志或相 ...
【技术保护点】
【技术特征摘要】
1.一种方法,包括:扩充用于机器学习模块(1)的训练数据集(11*),所述机器学习模块(1)要将输入图像数据(11)映射到关于使用方法进行图像分类而言是有意义的输出数据(13),所述方法包括:
•ꢀ
提供(110)与标签(13a)相关联的训练输入数据的样本(11a),从某种意义上说如果机器学习模块(1)将此训练输入数据的样本(11a)映射到与标签(13a)对应的输出数据(13),则这关于图像分类而言被认为是有意义的;
•ꢀ
从训练输入数据的样本(11a)和相关联的标签(13a)获得(120)难度函数(14),所述难度函数(14)被配置成将训练输入数据的样本(11a)或其在工作空间(20)中的表示(21a)映射到关于图像分类评估此样本(11a)的难度(14a)的度量;
•ꢀ
获得(130)训练输入数据的至少一个候选样本(15)和/或其在工作空间(20)中的表示(25);
•ꢀ
借助于难度函数(14),计算(140)关于图像分类评估此候选样本(15)和/或其表示(25)的难度(14a)的度量;以及
•ꢀ
响应于此难度满足预定标准(150),将候选样本(15)包括(160)在训练数据集(11*)中,并且进一步包括:利用扩充的训练数据集(11*)来训练机器学习模块(1)。2.根据权利要求1所述的方法(100),其中,图像分类包括:将输入数据(11)的每个记录映射到输出数据(13)的记录,所述输出数据(13)的记录针对多个离散类别的集合中的每个类别,指示输入数据的记录(11)属于相应类别的概率和/或置信度。3.根据权利要求2所述的方法(100),其中,难度函数(14)的获得(120)包括:基于训练输入数据的样本(11a)和相关联的标签(13a),训练(121)判别式分类器(16),其将训练输入数据的样本(11a)和/或其在工作空间(20)中的表示(21a)映射到指示此训练输入数据的样本(11a)属于离散类别中的每一个的概率和/或置信度的分类(16a),并且其中,由难度函数(14)确定的难度(14a)取决于此分类(16a)。4.根据权利要求3所述的方法(100),其中,由难度函数(14)确定的难度(14a)至少部分地基于分类(16a)的歧义。5.根据权利要求3或4中任一项所述的方法(100),其中,由难度函数(14)确定的难度(14a)至少部分地基于分类(16a)的熵。6.根据权利要求3至5中任一项所述的方法(100),进一步包括:将候选样本(15)与对应于由判别式分类器(16)确定的分类(16a)的标签相关联(141)。7.根据权利要求1至6中任一项所述的方法(100),其中,挑选(115)工作空间(20),使得:训练输入数据的样本(11a)关于图像分类的相似度与这些样本(11a)在工作空间(20)中的表示(21a)之间的距离的相关程度比其与这些样本(11a)之间的距离的相关程度相同或更高。8.根据权利要求7所述的方法(100),进一步包括:在工作空间(20)内实行(131)对训练输入数据的候选样本(15)的候选表示(25)的搜索,使得由难度函数(14)确定的难度(14a)满足预定标准(150),并且将此候选表示(25)变换(132)成候选样本(15)。9.根据权利要求8所述的方法(100),其中,搜索的实行(131)包括:基于工作空间(20)中的表示(2...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。