System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于自动驾驶车辆学习性能力的评价方法及系统技术方案_技高网

一种用于自动驾驶车辆学习性能力的评价方法及系统技术方案

技术编号:40202223 阅读:10 留言:0更新日期:2024-02-02 22:15
本发明专利技术公开了一种用于自动驾驶车辆学习性能力的评价方法,其包括:构建基于测试车辆的原始状态和目标状态的奖励函数;将测试车辆置于仿真测试场景中进行若干次测试,获得每一次测试车辆的完成状态;基于每一次测试车辆的完成状态,采用学习算法训练所述奖励函数;获得该学习算法下的奖励函数的值随测试次数变化的学习曲线;基于所述学习曲线提取该学习算法的学习时间、学习速度和学习容量,用于评价学习性能力。相应地,本发明专利技术还公开了一种用于自动驾驶车辆学习性能力的评价系统。本发明专利技术其从时间维度对自动驾驶车辆的测试评价进行了分析,通过提出的三个指标:学习时间、学习速度和学习容量,以衡量自动驾驶车辆算法的学习进化能力。

【技术实现步骤摘要】

本专利技术涉及一种测试方法及系统,尤其涉及一种对自动驾驶车辆算法进行评价的方法及系统。


技术介绍

1、近年来,随着人工智能技术的发展,自动驾驶技术的相关研究也越来越多。在自动驾驶车辆的研发过程中,需要对其进行大量的测试与评价,以保证自动驾驶车辆的安全性与可靠性。研究自动驾驶车辆的评价指标有利于促进自动驾驶车辆的设计和生产,提高自动驾驶车辆的智能化水平。

2、目前对自动驾驶车辆的评价主要着重于从安全性、舒适性等方面对车辆进行评价,大多数都为横向比较,即在相同测试场景中,从多个维度全面综合地比较多辆自动驾驶车辆的性能水平。而对于纵向比较,即自动驾驶车辆的学习进化能力,则缺少相应的技术手段。

3、目前自动驾驶车辆是朝着sae提出的l5级完全自动化级别发展,各大企业和厂商研发的自动驾驶车辆也多基于机器学习等方法,具有一定的学习能力,能够通过多次训练、测试,从历史数据中更新算法,在下一次测试中做出更好的表现。

4、基于当前的状况,期望提供一种方法,其能够对自动驾驶算法的学习进化能力进行评价,以推动自动驾驶车辆的开发。


技术实现思路

1、本专利技术的目的之一在于提供一种用于自动驾驶车辆学习性能力的评价方法,其从时间维度对自动驾驶车辆的学习算法进行了分析,通过提出的三个指标:学习时间、学习速度和学习容量,以此衡量自动驾驶车辆算法的学习进化能力。

2、为了实现上述目的,本专利技术提出了一种用于自动驾驶车辆学习性能力的评价方法,其包括步骤:

>3、构建基于测试车辆的原始状态和目标状态的奖励函数;

4、将测试车辆置于仿真测试场景中进行若干次测试,获得每一次测试车辆的完成状态;

5、基于每一次测试车辆的完成状态,采用学习算法训练所述奖励函数;

6、获得该学习算法下的奖励函数的值随测试次数变化的学习曲线;

7、基于所述学习曲线提取该学习算法的学习时间、学习速度和学习容量,用于评价学习性能力。

8、在本专利技术所述的用于自动驾驶车辆学习性能力的评价方法中,可以根据不同的测试场景,构建不同的奖励函数,由于奖励函数的构建是现有学习算法中已经广泛采用的技术,而非本专利技术的改进点,因此本专利技术在此对其不再进行过多介绍和描述。

9、本专利技术对自动驾驶车辆进行大量仿真测试,然后根据仿真测试的结果采用不同的学习算法对奖励函数训练,然后根据自动驾驶车辆的学习算法在不同训练次数下功能完成度上的评分来获得学习曲线,根据学习曲线可获得自动不同的学习算法的学习时间、学习速度、学习容量。比较不同的学习算法的学习时间、学习速度、学习容量,就可以评价各学习算法的学习性。

10、进一步地,在本专利技术所述的用于自动驾驶车辆学习性能力的评价方法中:

11、所述学习时间为奖励函数的值达到设定值时的测试次数;

12、所述学习速度v(t)被表示为:其中δt表示变化时间,δs(t)表示变化时间内的奖励函数的值的变化量;

13、所述学习容量slc被表示为:其中δt表示时间的变化,s(t)表示t时刻奖励函数的值。

14、其中,学习时间是判断学习算法是否能够在较少的训练次数中达到较好的行驶效果的一个指标。在多次迭代(即训练)后,自动驾驶车辆的表现会趋于稳定,最终得到一个稳定的评分(即奖励函数的值)。在一些更具体的实施方式中,若奖励函数的值(也即车辆评分)在一定次数的测试后波动幅度设定的阈值内,例如在5%以内,则可以认为车辆算法稳定,此时的奖励函数的值记为sf。由此,在一个具体的实例中,学习时间可以定义为奖励函数的值达到0.9sf时的测试次数sl。该指标反映自动驾驶算法的收敛快慢,学习时间越小的车辆,越快到达稳定态,学习性越强。

15、在整个测试过程中,自动驾驶车辆性能评分(即奖励函数的值)的上升速率也会有变化,存在前期分数上升较快的车辆,在后期训练中上升较慢的情况。这种趋势无法通过学习时间表现出来,因此本专利技术还采用了学习速度v(t)来评价学习性,如公式(1)所示:

16、

17、该指标可以反映自动驾驶算法在整个过程中的学习能力,是对学习时间的补充,根据该指标不仅仅可以得到最终收敛的快慢,还可以观察车辆算法学习能力的整体变化。

18、另外,由于不同自动驾驶车辆算法的学习曲线表现出来的形式各不相同,仅从曲线上,有时难以比较。因此本专利技术还提出了学习容量slc的评价指标,以对车辆算法学习能力的综合表现情况进行定量计算,以量化的指标形式对车辆进行评价。在学习曲线上,学习容量slc表现为特定训练次数内学习曲线与时间轴所围的面积:

19、

20、在训练次数相同的情况下,学习容量slc越高的车辆学习算法,其学习性越强,在相同次数内提升幅度越大。

21、进一步地,在本专利技术所述的用于自动驾驶车辆学习性能力的评价方法中,获得该学习算法下的奖励函数的值随测试次数变化的学习曲线具体包括:

22、获得采用该学习算法训练所述奖励函数过程中的若干个时间步长的奖励函数时间序列;

23、对奖励函数时间序列进行滤波平滑处理,以得到该学习算法下的学习曲线。

24、在这种实施方式中,训练次数可以被转换为时间步长来进行表征。

25、进一步地,在本专利技术所述的用于自动驾驶车辆学习性能力的评价方法中,获得采用该学习算法训练所述奖励函数过程中的若干个时间步长的奖励函数时间序列具体包括:

26、调整该学习算法的参数,以获得不同参数对应的若干个时间步长的若干个奖励函数时间序列;

27、对奖励函数时间序列进行滤波平滑处理,以得到该学习算法下的学习曲线具体包括:

28、对各奖励函数时间序列进行滤波平滑处理,以得到该学习算法下对应于不同参数的若干个学习曲线。

29、也就是说,在上述这种实施方式中,在采用学习算法训练奖励函数的过程中,还可以调整学习算法的参数,进而获得各不同的参数对应的学习曲线,从而分析各参数对学习性的影响。

30、进一步地,在本专利技术所述的用于自动驾驶车辆学习性能力的评价方法中,在基于所述学习曲线提取该学习算法的学习时间、学习速度和学习容量步骤之后还包括:

31、对该学习算法的各参数对应的各学习时间、学习速度和学习容量分别进行归一化处理,以得到学习时间评分sl′、学习速度评分vt′和学习容量评分sl′c。

32、归一化处理可通过下式进行计算:

33、

34、

35、

36、其中slmax,slmin分别表示对应各参数的所有的测试中最长的学习时间和最短的学习时间;vtmax,vtmin分别表示对应各参数的所有的测试中最快的学习速度和最慢的学习速度;slcmax,slcmin分别表示对应各参数的所有的测试中最高的学习容量和最低的学习容量。

37、进一步地,在本专利技术所述的用于自动驾驶车辆学习性能力的评价本文档来自技高网...

【技术保护点】

1.一种用于自动驾驶车辆学习性能力的评价方法,其特征在于,包括:

2.如权利要求1所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于,获得该学习算法下的奖励函数的值随测试次数变化的学习曲线具体包括:

3.如权利要求2所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于,获得采用该学习算法训练所述奖励函数过程中的若干个时间步长的奖励函数时间序列具体包括:

4.如权利要求3所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于,在基于所述学习曲线提取该学习算法的学习时间、学习速度和学习容量步骤之后还包括:

5.如权利要求4所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于,在得到学习时间评分、学习速度评分和学习容量评分步骤之后还包括:

6.如权利要求1所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于:

7.一种用于自动驾驶车辆学习性能力的评价系统,其特征在于,包括:

8.如权利要求7所述的用于自动驾驶车辆学习性能力的评价系统,其特征在于,所述评价模块获得该学习算法下的奖励函数的值随测试次数变化的学习曲线具体执行步骤:

9.如权利要求8所述的用于自动驾驶车辆学习性能力的评价系统,其特征在于,获得采用该学习算法训练所述奖励函数过程中若干个时间步长下的奖励函数时间序列具体包括:

10.如权利要求9所述的用于自动驾驶车辆学习性能力的评价系统,其特征在于,所述评价模块在基于所述学习曲线提取该学习算法的学习时间、学习速度和学习容量步骤之后还执行:

11.如权利要求10所述的用于自动驾驶车辆学习性能力的评价系统,其特征在于,所述评价模块在得到学习时间评分、学习速度评分和学习容量评分步骤之后还执行:

...

【技术特征摘要】

1.一种用于自动驾驶车辆学习性能力的评价方法,其特征在于,包括:

2.如权利要求1所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于,获得该学习算法下的奖励函数的值随测试次数变化的学习曲线具体包括:

3.如权利要求2所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于,获得采用该学习算法训练所述奖励函数过程中的若干个时间步长的奖励函数时间序列具体包括:

4.如权利要求3所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于,在基于所述学习曲线提取该学习算法的学习时间、学习速度和学习容量步骤之后还包括:

5.如权利要求4所述的用于自动驾驶车辆学习性能力的评价方法,其特征在于,在得到学习时间评分、学习速度评分和学习容量评分步骤之后还包括:

6.如权利要求1所述的用于自动驾驶车辆学习性能力的评价方法,...

【专利技术属性】
技术研发人员:李成邓锐苏奕敏叶晓倩周俊洁
申请(专利权)人:上汽大众汽车有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1