当前位置: 首页 > 专利查询>罗伯特专利>正文

修改表征计算机视觉模型的参数集制造技术

技术编号:34383087 阅读:24 留言:0更新日期:2022-08-03 21:02
本说明书涉及一种用于修改第一视觉参数规范以提供表征计算机视觉模型的第二视觉参数规范的计算机实现的方法。相关联的方面涉及用于提供训练数据集的计算机实现的方法、用于训练计算机视觉模型的计算机实现的方法、装置、计算机程序和计算机可读介质。计算机视觉关注计算机如何从数字图像或视频中自动获得高级别的理解。计算机视觉系统越来越多地应用于汽车或机器人车辆领域。然而,这样的系统的验证是一项复杂的任务。在计算机视觉系统中使用的计算机视觉模型的特征在于,定义了计算机视觉模型的操作设计域的视觉参数规范。本说明书讨论了如何通过根据计算机视觉模型的灵敏度分析改进视觉参数规范来修改表征计算机视觉模型(16)的操作设计域的视觉参数规范。觉模型(16)的操作设计域的视觉参数规范。觉模型(16)的操作设计域的视觉参数规范。

【技术实现步骤摘要】
修改表征计算机视觉模型的参数集


[0001]本说明书涉及一种用于修改第一视觉参数规范以提供表征计算机视觉模型的第二视觉参数规范的计算机实现的方法。相关联的方面涉及用于提供训练数据集的计算机实现的方法、用于训练计算机视觉模型的计算机实现的方法、装置、计算机程序和计算机可读介质。

技术介绍

[0002]计算机视觉涉及计算机能够如何从数字图像或视频中自动获得高级别的理解。计算机视觉系统越来越多地应用于汽车或机器人车辆领域。计算机视觉可以处理来自至少一个检测器和该检测器的环境之间的任何交互的输入。所述环境可以被所述至少一个检测器感知为一个场景或一系列场景。特别地,交互可以由至少一个相机、多相机系统、RADAR系统或LIDAR系统产生。
[0003]在汽车计算机视觉系统中,尽管仍然是安全关键的,但是计算机视觉经常必须处理开放的环境。因此,重要的是,在设计和测试计算机视觉模型时都要考虑定量的保障手段。自动驾驶中的目前计算机视觉开发方法高度依赖于专家(人类)输入,这降低了计算机视觉模型的可预测性。因此,计算机视觉的发展可以被进一步改进。

技术实现思路

[0004]根据第一方面,提供了一种用于修改第一视觉参数规范以提供表征计算机视觉模型的第二视觉参数规范的计算机实现的方法,其中该方法包括:

获得计算机视觉模型,所述计算机视觉模型被配置为执行表征所观察场景的元素的计算机视觉功能;

获得包括至少一个初始视觉参数集的第一视觉参数规范,其中基于所述至少一个视觉参数集的范围提供的视觉数据项能够影响所述计算机视觉模型的分类或回归性能;

提供视觉数据集,所述视觉数据集包括符合第一视觉参数规范的视觉数据项子集和对应的基准真值数据项子集;

将所述视觉数据项子集应用于所述计算机视觉模型,以使用对应的基准真值数据来获得多个性能评分,所述多个性能评分表征当应用于所述视觉数据集的视觉数据项子集时所述计算机视觉模型的性能;

在所述第一视觉参数规范的域上执行所述多个性能评分的灵敏度分析;和

生成包括至少一个更新的视觉参数集的第二视觉参数规范,其中基于灵敏度分析的结果修改所述至少一个初始视觉参数集以提供至少一个更新的视觉参数集。
[0005]根据第一方面的方法有利地使得能够实现已经被自动改进的细化视觉参数规范的自动定义,以包含一个或多个视觉参数集,所述一个或多个视觉参数集被调整以避免目标计算机视觉模型的弱点(例如,导致高方差的参数组合)。
[0006]视觉参数规范可以被细化为包括导致性能评分的大的输出方差的视觉参数。例
如,根据第二视觉参数规范被选取为训练数据的图像对于训练计算机视觉模型可以是有用的,因为通过避免具有较高方差的样本,根据这样的视觉参数规范选取的图像将不会导致使用如下的输入数据来训练计算机视觉模型:所述输入数据通过提供不正确的预测而导致计算机视觉模型表现不佳。
[0007]在训练或验证计算机视觉模型时,减少视觉参数规范(或计算机视觉模型的操作设计域)中的一个或多个冗余参数等同于参数空间的大小(并且因此,计算复杂度)的显著减小,从而使得能够实现更快且更节能的训练和/或验证过程。
[0008]视觉参数是影响机器视觉功能对所显示场景的理解的图像或视频的任何方面。作为一个示例,视觉参数可以是太阳相对于本车辆(ego

vehicle)的角度、一天中的时间、场景中的建筑物和树木的高度和接近度、本车辆的速度、车辆相对于本车辆的速度和位置、本车辆前方路面的视觉特性等。
[0009]换句话说,第一步骤是找到导致性能的高方差的视觉参数,但是随后,在这些高方差参数内,目标是将这样的参数值(例如,太阳角)划分/聚类到具有良好性能并且具有低方差的子范围(因为目标是找到ODD)中,并且利用彻底的验证步骤来对此进行测试。因此,在一个示例中,最终目标是具有低的性能评分方差的ODD。
[0010]作为一个具体的示例,在太阳直接位于本车辆前面的情况下的潮湿路面可能会导致附加的眩光被指向本车辆的前挡风玻璃。由于增加的眩光,因此这种状况可能会影响计算机视觉模型对位于本车辆前方的道路标志进行分类的准确程度。因此,在所描述的状况下,计算机视觉模型的道路标志标识任务更可能错误标识道路标志。因此,计算机视觉模型的性能示出较高的结果方差。
[0011]在计算机视觉模型的训练期间,对训练数据集的控制使得能够训练计算机视觉模型以解决困难状况。定义了一个操作设计域(ODD),它描述了应该如何使用计算机视觉功能。典型地,计算机视觉模型的训练应当包括ODD,但是取决于CV功能的概化性能,即使不在ODD上训练CV功能,CV功能也能够在ODD上良好地执行。典型地,操作设计域的定义是需要领域专家的输入的高度手动的任务。
[0012]根据本说明书,领域专家可以提供初始操作设计域,或者本说明书中所述的“第一视觉参数规范”。
[0013]一旦应用于向自主车辆、机器人或无人机的控制系统提供输入的计算机视觉模型,根据本说明书训练的计算机视觉模型就将更可靠地执行,从而导致自主车辆、机器人或无人机的安全性的提高。
[0014]本说明书描述了一种系统,该系统使用初始操作设计域自动分析计算机视觉模型对训练数据的性能,并且自动提供第二操作设计域或“第二视觉参数规范”,所述“第二视觉参数规范”具有通过迭代细化来改进的视觉参数。所述第二视觉参数规范基于所述计算机视觉模型在根据初始视觉参数集选取的测试训练集上的性能的灵敏度分析来提供。
[0015]换句话说,如果初始视觉参数集导致计算机视觉模型表现不佳,则可以在第二视觉参数规范中减弱、缩小范围或移除这样的参数。特别地,可以确定视觉参数的优先顺序,并且初始视觉参数的子范围被定义为计算机视觉模型的安全操作区域。在某些情况下,视觉参数可以拆分为几个子参数。
[0016]安全操作区域是当标识训练数据的场景中的元素时计算机视觉模型的性能在其
中对给定视觉参数的变化相对不敏感的区域。
[0017]一般而言,该方法使得能够使用可重复的自动过程来自动生成操作设计域,该可重复的自动过程使得能够解决视觉参数的模糊解释。因此,根据第一方面的方法生成的一个或多个视觉参数规范可以用作针对实现计算机视觉功能的计算机视觉模型的经验验证的测试用例。该方法基于经验结果实施决策。
[0018]换句话说,第一方面分析在测试或统计评估计算机视觉模型时哪些视觉参数具有最大的影响。给定视觉参数集和计算机视觉模型作为输入,输出视觉参数的排序列表。通过从排序列表中选择视觉参数的子列表,定义第二视觉参数规范的简化输入模型(本体)。
[0019]根据实施例,用于修改第一视觉参数规范以提供第二视觉参数规范的计算机实现的方法,其中所述第二视觉参数规范用于提供用于训练计算机视觉模型的训练数据。
[0020]第二方面提供了一种用于提供训练数据集的计算机实现的方法,包括:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于修改第一视觉参数规范以提供表征计算机视觉模型的第二视觉参数规范的计算机实现的方法,其中所述方法包括:

获得(102)计算机视觉模型(16),所述计算机视觉模型(16)被配置为执行表征所观察场景的元素的计算机视觉功能;

获得(104)包括至少一个初始视觉参数集的第一视觉参数规范,其中基于所述至少一个视觉参数集的范围提供的视觉数据项能够影响所述计算机视觉模型的分类或回归性能;

提供(106)视觉数据集,所述视觉数据集包括符合所述第一视觉参数规范的视觉数据项子集,以及对应的基准真值数据项子集;

将所述视觉数据项子集应用(108)于所述计算机视觉模型以获得多个性能评分,所述多个性能评分使用对应的基准真值数据表征当应用于所述视觉数据集的视觉数据项子集时所述计算机视觉模型的性能;

在所述第一视觉参数规范的域上执行(110)所述多个性能评分的灵敏度分析;和

生成(112)包括至少一个更新的视觉参数集的第二视觉参数规范,其中基于灵敏度分析的结果修改所述至少一个初始视觉参数集,以提供至少一个更新的视觉参数集。2.根据权利要求1所述的计算机实现的方法(100),其中获得多个性能评分进一步包括:

使用计算机视觉模型生成视觉数据项子集中的所观察场景的元素的多个预测,其中所述多个预测包括视觉数据子集中的至少一项的分类标签和/或至少一个回归值的至少一个预测;和

将视觉数据项子集中的元素的多个预测与对应的基准真值数据子集进行比较,从而获得多个性能评分。3.根据权利要求1或2之一所述的计算机实现的方法(100),进一步包括:

基于标识条件使用多个性能评分来标识所述第一视觉参数规范的至少一个初始视觉参数集,并且其中,生成所述第二视觉参数规范包括:通过将所述至少一个初始视觉参数集划分为至少第一修改的视觉参数集和第二修改的视觉参数集来修改所述至少一个初始视觉参数集,或者将第一视觉参数集和第二视觉参数集组合成聚类。4.根据前述权利要求之一所述的计算机实现的方法(100),

使用多个性能评分来标识第一视觉参数规范的至少一个初始视觉参数集,并且其中,生成所述第二视觉参数规范包括通过在其域上放大或缩小所述至少一个初始视觉参数集的范围来修改所述至少一个初始视觉参数集,从而产生修改的视觉参数集。5.根据前述权利要求之一所述的计算机实现的方法(100),其中,执行灵敏度分析进一步包括:

计算关于第一视觉参数规范的初始视觉参数的多个性能评分中的各个性能评分的多个方差;和

基于所计算的多个方差对所述第一视觉参数规范的初始视觉参数进行排名。6.根据前述权利要求之一所述的计算机实现的方法(100),其中,提供符合所述第一视觉参数规范的视觉数据集进一步包括:

对被包括在第一视觉参数集中的至少一个初始视觉参数集进行采样,以获得采样的
初始视觉参数值集;和

使用所述采样的初始视觉参数值集获得初始视觉参数值的视觉数据集。7.根据权利要求6所述的计算机实现的方法(100),其中所述至少一个初始视觉参数集的采样使用组合测试或通过拉丁超立方采样来执行。8.根据前述权利要求之一所述的计算机实现的方法(100),其中,所述第一视觉参数规范的域包括有限维向量空间中允许视觉参数位于其中的数值表示子集,可选地,连续或离散视觉参数的多维区间,或者有限维向量空间中视觉参数的数值表示集。9.根据前述...

【专利技术属性】
技术研发人员:C
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1