基于交通事故记忆网络的车辆控制方法、装置及设备制造方法及图纸

技术编号:24393553 阅读:42 留言:0更新日期:2020-06-06 02:56
本发明专利技术涉及无人自动驾驶技术领域,尤其涉及一种基于交通事故记忆网络的车辆控制方法、装置及设备。通过对已发生的交通事故场景数据进行学习获得负样本、对真实道路场景数据进行学习获得正样本,基于正样本和负样本对机器学习模型进行训练得到交通事故记忆网络模型,后续应用中,通过将车辆采集的道路场景输入交通事故记忆网络模型,利用该模型获得该道路场景下各种可能的动作对应的特征值,再基于特征值确定欲执行的目标动作,从而根据目标动作所对应的控制参数来对车辆进行控制,能够大幅降低交通事故发生的概率,提高行驶安全性。

Vehicle control method, device and equipment based on traffic accident memory network

【技术实现步骤摘要】
基于交通事故记忆网络的车辆控制方法、装置及设备
本专利技术涉及无人自动驾驶
,尤其涉及一种基于交通事故记忆网络的车辆控制方法、装置及设备。
技术介绍
随着汽车工业的发展和人民生活水平的提高,汽车的保有量呈现出逐年上涨的趋势。汽车给人们出行带来极大便利的同时,交通事故的发生也是不断的攀升。而导致交通事故的很大原因是人的因素,如:酒后驾驶、疲劳驾驶、频繁变道、弯道超车、变道不打转向灯、见缝插针、行车安全车距保持不够、追求刺激而飚车、由于斗气而别车等等。在无人驾驶的技术中,摄像头和激光雷达取代了人眼,机器学习和神经网络则取代了人的大脑,无人驾驶AI技术的出现将排除由于人的心理因素而造成的交通事故。无人车将不断的感知周围的环境、进行纯粹的数据处理并做出非常理性的行驶决策。根据兰德公司(RANDCorporation)的研究报告,要证明无人车较人类驾驶的安全性,需要在各种交通场景下对100辆车进行24小时连续225年的全天测试。因此如何通过模拟仿真场景取代实车的路测场景来训练无人车神经网络的模型,如何使用模拟仿真系统建造各种道路交通本文档来自技高网...

【技术保护点】
1.一种基于交通事故记忆网络的车辆控制方法,其特征在于,包括:/n获取道路场景;/n将所述道路场景作为待识别状态输入交通事故记忆网络模型,通过所述交通事故记忆网络模型对所述待识别状态进行识别分析,得到所述待识别状态下动作集中每个动作对应的特征值;/n根据各动作对应的特征值从所述动作集中确定目标动作;/n获取所述目标动作对应的控制参数,所述控制参数用于指示所述待识别状态下使所述车辆避免交通事故的驾驶行为;/n将所述控制参数输出至车辆的控制系统,以使所述控制系统基于所述控制参数对所述车辆进行控制。/n

【技术特征摘要】
1.一种基于交通事故记忆网络的车辆控制方法,其特征在于,包括:
获取道路场景;
将所述道路场景作为待识别状态输入交通事故记忆网络模型,通过所述交通事故记忆网络模型对所述待识别状态进行识别分析,得到所述待识别状态下动作集中每个动作对应的特征值;
根据各动作对应的特征值从所述动作集中确定目标动作;
获取所述目标动作对应的控制参数,所述控制参数用于指示所述待识别状态下使所述车辆避免交通事故的驾驶行为;
将所述控制参数输出至车辆的控制系统,以使所述控制系统基于所述控制参数对所述车辆进行控制。


2.根据权利要求1所述的方法,其特征在于,所述根据各动作对应的特征值从所述动作集中确定目标动作包括:
将所述动作集中特征值最大的动作作为所述目标动作。


3.根据权利要求1所述的方法,其特征在于,所述获取所述目标动作对应的控制参数,所述控制参数用于指示所述待识别状态下使所述车辆避免交通事故的驾驶行为,包括:
根据预设的动作与控制参数的映射关系,确定与所述目标动作对应的控制参数,所述控制参数包括油门踏板的踩踏力度、刹车踏板的踩踏力度和/或转向盘的转动角度。


4.根据权利要求1所述的方法,其特征在于,所述交通事故记忆网络模型按照以下方式训练得到:
构建机器学习模型,所述机器学习模型包括训练网络和评估网络,所述评估网络的输出层与所述训练网络的输入层连接;
获取样本数据,所述样本数据包括正样本集合和负样本集合,所述正样本集合和负样本集合中每个样本包括第一样本状态、样本动作、样本奖励和执行所述样本动作后的第二样本状态;
基于所述样本数据训练所述机器学习模型,得到所述交通事故记忆网络模型。


5.根据权利要求4所述的方法,其特征在于,所述基于所述样本数据训练所述机器学习模型,得到所述交通事故记忆网络模型,包括:
从所述样本数据中随机抽取预设数量的正样本和负样本,将抽取的正样本或负样本作为训练样本;
将所述训练样本的第二样本状态输入所述训练网络,输出在所述第二样本状态下所有可执行动作的特征值的集合;
根据所述第二样本状态下所有可执行动作的特征值的集合、所述训练样本的第一样本状态、样本动作和样本奖励,计算得到目标特征值;
将所述训练样本的第一样本状态和样本动作输入所述评估网络,输出得到预测特征值;
将所述预测特征值与所述目标特征值进行对比,计算得到特征损失值;
按照所述特征损失值调整所述机器学习模型中的参数值,直至所确定的特征损失值达到训练停止条件时,将所述机器学习模型作为所述交通事故记忆网络模型。


6.根据权利要求4所述的方法,其特征在于,所述获取样本数据,所述样本数据包括正样本集合和负样本集合,所述正样本集合和负样本集合中每个样本包括第一样本状态、样本动作、样本奖励和执行所述样本动作后的第二样本状态,包括:
基于已发生的交通事故场景数据获取负样本集合;
基于车辆在真实道路场景中采集的数据生成正样本集合。

【专利技术属性】
技术研发人员:张彦君
申请(专利权)人:浙江吉利汽车研究院有限公司浙江吉利控股集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1