一种自动驾驶系统的任务调度策略生成方法及装置制造方法及图纸

技术编号:39436096 阅读:9 留言:0更新日期:2023-11-19 16:19
本发明专利技术提供一种自动驾驶系统的任务调度策略生成方法、任务调度方法及装置,所述方法包括:获取训练配置数据;其中,所述配置数据包括任务调度周期、核数、调度任务集、训练参数、调度约束条件和调度优化目标函数;根据所述训练参数对应的训练数据、所述任务调度周期、所述核数、所述调度任务集、调度约束条件和调度优化目标函数以及调度任务的马尔科夫决策模型进行强化学习训练,获得所述任务调度策略;其中,所述调度任务的马尔科夫决策模型是预设的。所述装置用于执行上述方法。本发明专利技术实施例提供的自动驾驶系统的任务调度策略生成方法、任务调度方法及装置,提高自动驾驶的安全性。提高自动驾驶的安全性。提高自动驾驶的安全性。

【技术实现步骤摘要】
一种自动驾驶系统的任务调度策略生成方法及装置


[0001]本专利技术涉及自动控制
,具体涉及一种自动驾驶系统的任务调度策略生成方法、任务调度方法及装置。

技术介绍

[0002]自动驾驶系统(Autonomous Driving System,简称ADS)包括多种传感器,能够基于传感器采集的数据执行相关的计算任务,以实现感知、运动规划与控制。
[0003]自动驾驶系统的任务调度应以最小化车辆的驾驶决策生成时间与真实环境之间的差距为目标。虽然大量研究提出了模型与优化算法,以缩短执行时间并提升精度。自动驾驶任务的调度属于实时流处理的任务调度的范畴,其中计算任务的相互依赖性由有向无环图(Directed Acyclic Graph,简称DAG)来描述。传统的DAG调度,即对多核的依赖任务调度已经研究多年,但是大部分研究考虑的性能指标是响应时间和计算吞吐量,这些指标与驾驶安全并非直接相关,对保障驾驶安全性的影响有限。

技术实现思路

[0004]针对现有技术中的问题,本专利技术实施例提供一种自动驾驶系统的任务调度策略生成方法、任务调度方法及装置,能够至少部分地解决现有技术中存在的问题。
[0005]第一方面,本专利技术提出一种自动驾驶系统的任务调度策略生成方法,包括:
[0006]获取训练配置数据;其中,所述配置数据包括任务调度周期、核数、调度任务集、训练参数、调度约束条件和调度优化目标函数;
[0007]根据所述训练参数对应的训练数据、所述任务调度周期、所述核数、所述调度任务集、调度约束条件和调度优化目标函数以及调度任务的马尔科夫决策模型进行强化学习训练,获得所述任务调度策略;其中,所述调度任务的马尔科夫决策模型是预设的。
[0008]第二方面,本专利技术提供一种基于上述任一实施例所述的自动驾驶系统的任务调度策略生成方法生成的任务调度策略的自动驾驶系统的任务调度方法,包括:
[0009]获取各个传感器周期性采集的传感器数据;
[0010]基于任务调度策略,在每个任务调度周期内获取对应的传感器数据执行各个计算任务生成对应的控制指令;其中,每个调度任务与传感器数据的对应关系是预设的。
[0011]再一方面,本专利技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述的自动驾驶系统的任务调度策略生成方法或者自动驾驶系统的任务调度方法。
[0012]又一方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述的自动驾驶系统的任务调度策略生成方法或者自动驾驶系统的任务调度方法。
[0013]本专利技术实施例提供的自动驾驶系统的任务调度策略生成方法、任务调度方法及装置,能够获取训练配置数据;其中,配置数据包括任务调度周期、核数、调度任务集、训练参
数、调度约束条件和调度优化目标函数;根据训练参数对应的训练数据、任务调度周期、核数、调度任务集、调度约束条件和调度优化目标函数以及调度任务的马尔科夫决策模型进行强化学习训练,获得任务调度策略,能够应用于自动驾驶系统的任务调度,优化车载计算资源的利用,提高自动驾驶的安全性。
附图说明
[0014]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0015]图1是本专利技术第一实施例提供的自动驾驶系统的任务调度策略生成方法的流程示意图。
[0016]图2是本专利技术第二实施例提供的自动驾驶系统的任务调度方法的流程示意图。
[0017]图3是本专利技术第三实施例提供的自动驾驶系统的任务调度策略生成装置的结构示意图。
[0018]图4是本专利技术第四实施例提供的自动驾驶系统的任务调度装置的结构示意图。
[0019]图5是本专利技术第五实施例提供的电子设备的实体结构示意图。
具体实施方式
[0020]为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本专利技术实施例做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0021]为了便于理解本申请提供的技术方案,下面先对本申请技术方案的相关内容进行说明。
[0022]自动驾驶系统(ADS)在实际应用中,涉及到多种传感器的数据采集,以及基于传感器采集的数据执行计算任务生成控制指令。当计算任务放入到算法堆栈时,对计算任务的调度会极大地影响驾驶决策中的数据新鲜度,从而影响驾驶安全。因此,本申请提出控制命令的信息年龄(Age of information,简称AoI)作为自动驾驶系统中任务调度的性能指标,通过调度任务的马尔科夫决策模型的强化学习训练,获得自动驾驶系统的任务调度策略,并将任务调度策略应用于自动驾驶系统中,能够提高车载计算资源的利用率,提高自动驾驶的安全性。其中,控制命令的信息年龄是指生成控制命令的时间戳与上一轮用于生成控制命令的传感器数据的最小时间戳的时间差,即控制命令的生成时间减去上一轮用于生成控制命令的传感器数据的最早采集时间的差值。计算任务是指通过对传感器数据的处理生成控制指令的过程中所涉及到的各个计算任务,比如图像识别,定位,基于激光雷达目标检测,轨迹规划等。控制指令比如转向、油门、刹车等。一个控制命令的生成涉及多个计算任务。
[0023]为了通过控制命令的信息年龄对自动驾驶系统中的任务调度进行优化,构建了整数规划问题,决策变量为感知数据选取变量y
kk

z
,即传感器z的第k

帧数据是否会在第k轮
被对应的计算任务执行使用,以及计算任务在核上的执行变量x
jkpt
,即计算任务j在核p中于时间t开始执行第k轮计算。由于自动驾驶系统中的计算时间单位是毫秒级,调度计算任务会产生巨大的决策变量空间,导致整数规划问题不可解,所以设计了周期性的调度方案,该调度方案为周期性策略下的最优解。具体来说,周期性的调度方案指的是给定周期T0,计算任务是以T0为周期,重复进行的,传感器数据的采集周期也与周期T0匹配,即周期T0为采集周期的公倍数。从而将整数规划问题,转换为周期性的调度问题。为了求解上述周期性的调度问题获得任务调度策略,建立调度任务的马尔科夫决策模型,以任务调度周期内各轮调度中各个控制命令的信息年龄中最大的信息年龄最小为目标构建调度优化目标函数,并设置相关约束条件,对调度任务的马尔科夫决策模型进行模型训练。
[0024]下面以服务器作为执行主体为例,对本专利技术实施例提供的自动驾驶系统的任务调度策略生成方法的具体实现过程进行说明。可理解的是,本专利技术实施例提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶系统的任务调度策略生成方法,其特征在于,包括:获取训练配置数据;其中,所述配置数据包括任务调度周期、核数、调度任务集、训练参数、调度约束条件和调度优化目标函数;根据所述训练参数对应的训练数据、所述任务调度周期、所述核数、所述调度任务集、调度约束条件和调度优化目标函数以及调度任务的马尔科夫决策模型进行强化学习训练,获得所述任务调度策略;其中,所述调度任务的马尔科夫决策模型是预设的。2.根据权利要求1所述的方法,其特征在于,所述训练参数包括传感器相关特性参数、计算任务相关特征参数和核相关特性参数,其中:所述传感器相关特性参数包括每个传感器的采集周期、每个传感器对应的第一时间差、每个传感器对应的第二时间差和每个传感器对应的第三时间差;所述第一时间差等于当前时间与当前轮使用的传感器采集数据的采集时间的时间差;所述第二时间差等于当前时间与上一轮使用的传感器采集数据的采集时间的时间差;所述第三时间差等于当前时间与传感器下次采集数据的采集时间的时间差;所述计算任务相关特征参数包括每个计算任务的执行时间、每个计算任务对应的时间间隔和每个计算任务的执行要求;所述计算任务对应的时间间隔等于当前时间与所述计算任务在当前轮的开始执行时间的时间间隔;所述计算任务的执行要求为所述计算任务对应的前序任务是否执行完成;所述核相关特性参数包括当前决策点考虑的核的标识、每个核的当前时间与下一个可用时间之间的时间间隔。3.根据权利要求1所述的方法,其特征在于,所述任务调度周期为所有传感器的采集周期的公倍数。4.根据权利要求1所述的方法,其特征在于,所述调度任务的马尔科夫决策模型包括决策过程,其中:所述决策过程通过四维度(S,A,P,R)表示,S表示状态空间,所述状态空间包括传感器相关特性参数、计算任务相关特征参数和核相关特性参数;A表示动作空间,所述动作空间包括计算任务;P表示过渡概率函数;R表示奖励函数,所述奖励函数表示为1/(αD),α为大于等于2的正整数,D表示控制命令的信息年龄。5.根据权利要求4所述的方法,其特征在于,控制命令的信息年龄为计算任务生成控制命令的时间戳与上一轮用于生成控制命令的传感器数据的最小时间戳的时间差。6.根据权利要求1所述的方法,其特征在于,所述调度优化目标函数表示为:其中,c
nk
为第k轮生成控制命令的时间戳,S
k
‑1为第k

1轮调度...

【专利技术属性】
技术研发人员:徐倩徐程远汪建平
申请(专利权)人:香港城市大学深圳研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1