当前位置: 首页 > 专利查询>罗伯特专利>正文

在监控是否离开训练的应用范围的情况下运行可训练模块制造技术

技术编号:32207488 阅读:13 留言:0更新日期:2022-02-09 17:13
用于运行可训练模块(1)的方法(100),具有步骤:

【技术实现步骤摘要】
【国外来华专利技术】在监控是否离开训练的应用范围的情况下运行可训练模块


[0001]本专利技术涉及如例如在至少部分自动驾驶时为了分类任务和/或对象识别所使用的可训练模块的运行。

技术介绍

[0002]在道路交通中由人类驾驶员对车辆的驾驶通常被训练,其方式是迫使驾驶学员在其培训的范围中反复地面对特定的状况准则。驾驶学员必须对这些状况分别做出反应,并且通过驾驶教练的评论或者甚至干预来获得关于其反应是正确还是错误的反馈。利用有限数量的状况的这种训练应该使驾驶学员有能力在独立驾驶车辆时也掌握未知的状况。
[0003]为了让车辆完全或部分地自动参与道路交通,力求利用以完全相似的方式可训练的模块来控制所述车辆。例如,这些模块从车辆环境中获得传感器数据作为输入参量,并且作为输出参量提供干预车辆的运行所利用的操控信号和/或构成这种操控信号的初级产品。例如,车辆的环境中的对象的分类可以是这种初级产品。

技术实现思路

[0004]在本专利技术的范围中,开发了一种用于运行可训练模块的方法。可训练模块将一个或多个输入参量值转变为一个或多个输出参量值。
[0005]可训练模块尤其是被视为以用于一般化的大的力度体现利用可适配参数参数化的函数的模块。在训练可训练的模块时,参数尤其是可以被适配为使得在将学习输入参量值输入到模块中时尽可能好地再现所属的学习输出参量值。可训练模块尤其是可以包含人工神经网络KNN,和/或所述可训练模块可以是KNN。
[0006]输入参量值包括通过物理测量过程和/或通过这样的测量过程的部分或完全模拟和/或通过可利用这样的测量过程观测的技术系统的部分或完全模拟获得的测量数据。例如,测量数据可以包括通过观测车辆的环境所记录的图像或扫描。
[0007]当针对这种应用训练可训练模块时,该训练原则上根据有限数量的学习情形、即利用有限数量的学习数据来进行。在训练时,可训练模块学习由于上述一般化力度也针对不是训练主题的许多其他情形具有有效性的关系。
[0008]如果使用可训练模块例如用于对交通标志、其他交通参与者、车道边界和其他对象进行分类,则训练典型地包括具有一定可变性的情形,所述可变性例如包括在车辆的运行中可能发生的天气条件、道路情况、季节和照明情况。在此,尤其是学习通常使得能够在图像中识别交通标志的这样的关系。因此,例如,仅很少出现在公共交通区域中、但在个别情况下极其重要的、警告提防不安全的河岸的交通标志129即使在训练中在其情况下看不到所述交通标志129的照明情况或天气条件下也被识别。
[0009]现在已经认识到,然而这种一般化力度也有局限性,所述局限性例如在运行至少部分自动的车辆时可能导致危急情形。
[0010]如果例如仅利用来自欧洲交通区域的图像进行了训练,并且然后在美国使用可训
练模块,则在欧洲不出现的美国交通标志可能错误地被分类。因此在美国例如存在许多交通标志,所述交通标志由处于尖端的黄色方块连同黑色文字组成(例如“Dead end”代表“死胡同”)。这样的交通标志可能例如被错误分类为在欧洲出现的包含处于尖端的黄色方块的单个交通标志。这是交通标志306“优先行驶路段”。在该具体示例中,差错可能导致至少部分自动化的车辆怀着能自由通行的信念在驶入死胡同时加速。
[0011]但是,即使可训练模块准确地被用在所述可训练模块被训练所针对的交通区域中,也可能出现可类比的情形。因此,自2008年以来在越来越多的城市可以看到的交通标志270“环境区”在视觉上与交通标志274.1“限速30区”非常相似。所述交通标志完全一样地包括红色圆圈,下方带有“区”字样,仅正是“环境”而不是“30”处于圆圈中。如果可训练模块尚未针对新的交通标志“环境区”被训练,则因此所述可训练模块可能将所述交通标志错误分类为“限速30区”。由于交通标志“环境区”在大城市中也完全可能出现在允许80 km/h或更高的速度的高速公路处,因此该差错可能导致车辆的突然猛刹车。这可能对于随后的交通是完全意外的,并且可能导致追尾事故。
[0012]为了避免这种危急情形,该方法规定将至少一个输入参量值输送给可训练模块的变种。这些变种至少如此程度地彼此不同,以致于所述变种不能通过渐进式学习彼此一致地转化。
[0013]例如,可以构成变种,其方式是包含在可训练模块中的人工神经网络(KNN)中的不同神经元分别被去活(“退出(Drop

out)”)。于是在所有变种中总共存在的神经元的不同子集是激活的。
[0014]对此替代地或也与此组合地,例如表征可训练模块的行为的参数可以被改变。
[0015]例如通过利用学习数据的不同子集训练KNN,可以获得不同的参数组。每个这样的参数组于是表征变种的行为。然而,也可以例如获得变种,其方式是以不同的顺序将学习数据输入到KNN中和/或其方式是利用不同的随机起始值初始化KNN的参数。
[0016]例如,对KNN的神经元之间的连接的经训练的权重也可以作为参数被改变,其方式是将所述权重乘以从预先给定的统计分布中随机抽取的数。
[0017]从所述变种将同一输入参量值分别转变成的输出参量值的彼此偏差中确定用于所述输出参量值的不确定性的度量。
[0018]在此,输出参量值可以例如是Softmax分数,所述Softmax分数说明学习数据组以哪些概率被分类成哪些可能的类别。
[0019]为了从大量输出参量值中确定不确定性可以使用任意统计函数或统计函数的组合。对这样的统计函数的示例是方差、标准偏差、平均值、中值、适当选择的分位数、熵和异众比率。
[0020]将不确定性与不确定性的分布进行比较。所述分布已经针对在训练所述可训练模块时所使用的学习输入参量值和/或针对在训练所述可训练模块时所学习的关系可应用到的其他测试输入参量值被确定。从比较的结果中评估:在训练所述可训练模块时所学习的关系能够在何种程度上应用于当前待处理的输入参量值,也即例如应用于当前待分类的来自车辆环境的图像。
[0021]因此,通过使用可训练模块的变种,似乎将输出参量值对输入参量值的分配置于“抖动状态”。在此,可以预期,针对在训练时学习的关系可应用到的这样的输入参量值的不
确定性的分布对于不安全性的较低值具有大频率的集中。根据这种分布“单独行动”的较大的不安全性于是可以被评价为针对在训练时学习的关系恰好不能应用于当前待处理的输入参量值的象征。在所提到的示例中,如果美国交通标志“死胡同”由在欧洲交通标志上训练的分类器分类,或者如果交通标志“环境区”由在引入该交通标志之前训练的分类器分类,则这例如可以被预期。从而可以抵抗这种分类器简单地输出在不考虑在交通事件中完全不同的语义含义的情况下在视觉上最接近当前待处理的交通标志的那个交通标志的趋势。
[0022]此外,不与分布相配的不确定性也可以表明输入参量值是“对抗性示例”。这可以被理解为以挑动通过可训练模块进行的错误分类为目的的故意操纵的输入参量值。因此,例如可以通过施加粘贴标牌和类似手段来操纵在公共场所中对于任何人都可使用的交本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于运行可训练模块(1)的方法(100),所述可训练模块将一个或多个输入参量值(11)转变成一个或多个输出参量值(13),其中所述输入参量值(11)包括通过物理测量过程和/或通过这样的测量过程的部分或完全模拟和/或通过能利用这样的测量过程观测的技术系统的部分或完全模拟获得的测量数据,所述方法具有步骤:

将至少一个输入参量值(11)输送给所述可训练模块(1)的变种(1a

1c)(110),其中所述变种(1a

1c)如此程度地彼此不同,以致于所述变种不能通过渐进式学习彼此一致地转化;

从所述变种(1a

1c)将所述输入参量值(11)分别转变成的输出参量值(13)的彼此偏差中确定用于所述输出参量值(13)的不确定性(13b)的度量(120);

将所述不确定性(13b)与不确定性(13b)的分布(13*)进行比较(130),所述分布已经针对在训练所述可训练模块(1)时所使用的学习输入参量值(11a)和/或针对在训练所述可训练模块(1)时所学习的关系能应用到的其他测试输入参量值(11c)被确定;

从所述比较(130)的结果(130a)中评估(140):在训练所述可训练模块(1)时所学习的关系能够在何种程度上应用于所述输入参量值(11)(140a、140b)。2.根据权利要求1所述的方法(100),其中所述变种(1a

1c)被构成,其方式是

包含在所述可训练模块(1)中的人工神经网络KNN中的各种神经元被去活(111),和/或

表征所述可训练模块(1)的行为的参数被改变(112),和/或

所述KNN中的神经元之间的连接被去活(113)。3.根据权利要求1至2中任一项所述的方法(100),其中响应于所述不确定性(13b)处于所述分布(13*)的预先给定的分位数内,确定(141)在训练所述可训练模块(1)时所学习的关系能够应用于所述输入参量值(11)(140a)。4.根据权利要求1至3中任一项所述的方法(100),其中响应于所述不确定性(13b)处于所述分布(13*)的预先给定的分位数之外,确定(142)在训练所述可训练模块(1)时所学习的关系不能应用于所述输入参量值(11)(140b)。5.根据权利要求1至4中任一项所述的方法(100),其中响应于所述不确定性(13b)小于所述分布(13*)中的最小不确定性(13b)的预先给定的份额或大于所述分布(13*)中的最大不确定性(13b)的预先给定的份额,确定(143)在训练所述可训练模块(1)时所学习的关系不能应用于所述输入参量值(11)(140b)。6.根据权利要求1至5中任一项所述的方法(100),其中选择可训练模块(1),所述可训练模块被构造为分类器和/或回归器。7.根据权利要求1至6中任一项所述的方法(100),其中响应于确定(140a)在训练所述可训练模块(1)时所学习的关系能够应用于所述输入参量值(11),在使用所述输入参量值(11)的情况下更新所述分布(13*)(150)。8.根据权利要求7所述的方法(100),其中
·
通过添加其他加数来更新一组参量(15)(151),所述参量分别取决于在对分布(13*)有贡献的所有输入参量值(11)和/或不确定性(13b)上形成的总和,和
·
从这些参量(15)中确定经更新的分布(13**)和/或表征所述经更新的分布(13**)的一组参数(16)(152)。
9.根据权利要求8所述的方法(100),其中利用矩方法和/或利用最大似然方法和/或利用贝叶斯估计来估计所述参数(16)(152a)。10.根据权利要求1至9中任一项所述的方法(100),其中响应于确定(140a)在训练所述可训练模块(1)时所学习的关系能够应用于所述输入参量值(11),
...

【专利技术属性】
技术研发人员:W
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1