自动驾驶的控制方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:36287007 阅读:71 留言:0更新日期:2023-01-13 09:58
本申请提供一种自动驾驶的控制方法、装置、设备和计算机可读存储介质。该方法包括:获取路况图像数据,将路况图像数据输入到已训练的神经网络模型,获得车辆的控制指令;根据车辆的控制指令控制车辆行驶。本申请的方法,已训练的神经网络模型是使用训练数据对神经网络模型和已训练的辅助训练网络模型进行训练获得的,其中,神经网络模型和已训练的辅助训练网络模型结构类似,实现识别复杂近似的多种驾驶场景。驾驶场景。驾驶场景。

【技术实现步骤摘要】
自动驾驶的控制方法、装置、设备和计算机可读存储介质


[0001]本申请涉及计算机
,尤其涉及一种自动驾驶的控制方法、装置、设备和计算机可读存储介质。

技术介绍

[0002]汽车行业处在一个变革的时代,自动驾驶相关技术发展应用如火如荼。自动驾驶如此火热,因为它能够降低出行成本,自动驾驶发展也会促进车辆共享化从而提升车辆利用率以及降低对停车位等资源的占用成本,还能提升通行效率。
[0003]在现有的自动驾驶技术中,车辆通过图像来感知周围的环境,同时使用路况信息和地图数据作为神经网络的输入,输出车辆的控制参数,如方向盘、刹车和油门。操纵车辆执行变道、超车、停车、转弯等动作。
[0004]然而,现实交通状况非常复杂,涉及的场景十分多样,给现有的自动驾驶技术带来很大的挑战,主要表现为自动驾驶策略只能适应某一种驾驶场景。

技术实现思路

[0005]本申请提供一种自动驾驶的控制方法、装置、设备和计算机可读存储介质,用以解决现有技术中无法适应多种复杂近似的驾驶场景的问题。
[0006]本申请一实施例提供一种自动驾驶的控制方法,包括:
[0007]获取路况图像数据,将路况图像数据输入到已训练的神经网络模型,获得车辆的控制指令;
[0008]根据车辆的控制指令控制车辆行驶;
[0009]其中,已训练的神经网络模型是使用训练数据对神经网络模型和已训练的辅助训练网络模型进行训练获得的,且在训练过程中已训练的辅助训练网络模型内参数不变。
[0010]在一实施例中,控制方法还包括:
[0011]获取车辆在仿真环境采集到的第一仿真图像数据,
[0012]将第一仿真图像数据输入到神经网络模型和已训练的辅助训练网络模型中,获得第一仿真图像对应的多个车辆控制动作的概率;
[0013]根据第一仿真图像对应的多个车辆控制动作的概率从多个车辆控制动作中选择一个目标车辆动作;
[0014]获取车辆在执行目标车辆动作后的第二仿真图像数据,并生成一个奖励值;
[0015]将第一仿真图像数据、第二仿真图像数据、奖励值以及目标车辆动作作为一组训练数据;其中,训练数据用于训练神经网络。
[0016]在一实施例中,控制方法还包括:
[0017]待获取到预设数量组的训练数据时,使用多组训练数据对神经网络模型、已训练的辅助训练网络模型以及测试网络模型进行多轮训练,获得已训练的神经网络模型;
[0018]其中,在每个训练循环中,将一组训练数据中第一仿真图像数据和目标车辆动作
输入神经网络模型和已训练的辅助训练网络模型,将第二仿真图像数据输入测试网络模型中;
[0019]根据神经网络模型内参数、已训练的辅助训练网络模型内参数、测试网络模型中参数、神经网络模型输出的不同车辆控制动作的概率值以及测试网络模型输出的不同车辆控制动作的概率值,计算损失值和更新神经网络模型内参数,当损失值小于预设阈值时停止训练;
[0020]其中,测试网络模型与神经网络模型和已训练的辅助训练网络模型构成的混合模型相同。
[0021]在一实施例中,控制方法还包括:
[0022]每隔预设轮数的训练,使测试网络模型中参数与神经网络模型和已训练的辅助训练网络模型构成的混合模型中相同。
[0023]在一实施例中,控制方法还包括:
[0024]采集用户干预控制的次数,当次数大于预设数量时对已训练的神经网络模型进行再次训练。
[0025]当次数大于预设数量时,采集车辆周围的环境数据,根据环境数据构建仿真环境。
[0026]在一实施例中,将一组训练数据中第一仿真图像数据和目标车辆动作输入神经网络模型和已训练的辅助训练网络模型,具体包括:
[0027]将第一仿真图像数据输入卷积神经网络处理,获得初始状态;
[0028]将初始状态输入到辅助神经网络,辅助神经网络输出每一层的神经元的数值;
[0029]将初始状态输入到主训练神经网络,主训练神经网络输出第一层的神经元的数值;
[0030]针对每层神经元,将辅助神经网络的上一层的神经元的数值和主训练神经网络的上一层的神经元的数据,输入到主训练神经网络的下一层的神经元,主训练神经网络输出下一层的神经元的数值。
[0031]本申请另一实施例提供一种检测装置,包括:
[0032]获取模块,用于获取路况图像数据,将路况图像数据输入到已训练的神经网络模型,获得车辆的控制指令,其中,已训练的神经网络模型是使用训练数据对神经网络模型和已训练的辅助训练网络模型进行训练获得的,且在训练过程中已训练的辅助训练网络模型内参数不变;
[0033]处理模块,用于根据车辆的控制指令控制车辆行驶。
[0034]本申请又一实施例提供一种检测设备,包括:存储器和处理器;
[0035]存储器内存储计算机执行指令;
[0036]处理器执行存储器存储的计算机执行指令,以实现上述实施例所涉及的方法。
[0037]本申请再一实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述实施例所涉及的方法。
[0038]本申请另一实施例提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述实施例所涉及的方法。
[0039]本申请提供的自动驾驶的控制方法、装置、设备和计算机可读存储介质,通过获取路况图像数据,将路况图像数据输入到已训练的神经网络模型,获得车辆的控制指令;根据
车辆的控制指令控制车辆行驶;其中,已训练的神经网络模型是使用训练数据对神经网络模型和已训练的辅助训练网络模型进行训练获得的,且在训练过程中已训练的辅助训练网络模型内参数不变。其中,神经网络模型和已训练的辅助训练网络模型结构类似,实现复杂近似的多种驾驶场景。
附图说明
[0040]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0041]图1为本申请一实施例提供的一种自动驾驶的控制方法流程图;
[0042]图2为本申请另一实施例提供的一种获取训练数据方法流程图;
[0043]图3为本申请又一实施例提供的一种获得已训练的神经网络模型方法流程图;
[0044]图4为本申请再一实施例提供的一种获得已训练的神经网络模型方法流程图;
[0045]图5为本申请另一实施例提供的一种将一组训练数据中第一仿真图像数据和目标车辆动作输入神经网络模型和已训练的辅助训练网络模型方法流程图;
[0046]图6为本申请另一实施例提供的检测装置的结构示意图;
[0047]图7为本申请又一实施例提供的一种检测设备结构示意图。
[0048]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶的控制方法,其特征在于,包括:获取路况图像数据,将所述路况图像数据输入到已训练的神经网络模型,获得车辆的控制指令;根据所述车辆的控制指令控制所述车辆行驶;其中,已训练的神经网络模型是使用训练数据对所述神经网络模型和已训练的辅助训练网络模型进行训练获得的,且在训练过程中所述已训练的辅助训练网络模型内参数不变。2.根据权利要求1所述的控制方法,其特征在于,所述方法还包括:获取所述车辆在仿真环境采集到的第一仿真图像数据,将所述第一仿真图像数据输入到所述神经网络模型和已训练的辅助训练网络模型中,获得所述第一仿真图像对应的多个车辆控制动作的概率;根据所述第一仿真图像对应的多个车辆控制动作的概率从所述多个车辆控制动作中选择一个目标车辆动作;获取所述车辆在执行所述目标车辆动作后的第二仿真图像数据,并生成一个奖励值;将所述第一仿真图像数据、所述第二仿真图像数据、所述奖励值以及所述目标车辆动作作为一组训练数据;其中,所述训练数据用于训练所述神经网络。3.根据权利要求2所述的控制方法,其特征在于,所述方法还包括:待获取到预设数量组的训练数据时,使用多组训练数据对所述神经网络模型、已训练的辅助训练网络模型以及测试网络模型进行多轮训练,获得已训练的神经网络模型;其中,在每个训练循环中,将一组训练数据中所述第一仿真图像数据和所述目标车辆动作输入所述神经网络模型和已训练的辅助训练网络模型,将所述第二仿真图像数据输入所述测试网络模型中;根据所述神经网络模型内参数、已训练的辅助训练网络模型内参数、所述测试网络模型中参数、所述神经网络模型输出的不同车辆控制动作的概率值以及所述测试网络模型输出的不同车辆控制动作的概率值,计算损失值和更新所述神经网络模型内参数,当所述损失值小于预设阈值时停止训练;其中,所述测试网络模型与所述神经网络模型和已训练的辅助训练网络模型构成的混合模型相同。4.根据权利要求3所述的控制方法,其特征在于,所述方法还包括:每隔预设轮...

【专利技术属性】
技术研发人员:于鹏孙宇李文军
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1