【技术实现步骤摘要】
自动驾驶车辆的权重系数和控制策略自学习方法及装置
[0001]本专利技术涉及车辆自动驾驶控制
,特别是指一种自动驾驶车辆的权重系数和控制策略自学习方法及装置。
技术介绍
[0002]车辆的智能控制技术是智能化汽车的核心体现。模型预测控制因为其能够考虑未来时刻信息,目前是智能驾驶的控制主流方法。然而模型预测控制由于通过滚动时域优化求解控制量,存在求解效率低下的难题。业界和学术界通过在线优化和离线预求解的方法来提高模型预测控制的求解速度。在线优化方法包含暖启动和提前终止迭代等方法,能够加快求解速度,但面对复杂问题时,求解效率仍然难以满足车辆的控制需求。离线预求解方法主要是显式MPC(Model Predictive Control,模型预测控制),该方法对状态空间进行划分,离线建立从状态量到最优控制律之间的映射关系,映射关系等可以用表格和神经网络等存储,在线应用时通过查表或者神经网络直接映射得到控制量,该方法能够在很大程度上提高求解实时性。然而为了追求高品质的控制效果,需要不断调整权重系数再训练策略以满足控制要求。这导致在 ...
【技术保护点】
【技术特征摘要】
1.一种自动驾驶车辆的权重系数和控制策略自学习方法,其特征在于,所述方法包括:S1、获取待优化的控制策略;S2、将所述待优化的控制策略输入到构建好的控制策略双层优化模型;其中,所述控制策略双层优化模型包括权重系数优化层以及控制策略优化层;S3、根据所述待优化的控制策略、权重系数优化层以及控制策略优化层,得到优化后的控制策略,基于所述优化后的控制策略对自动驾驶车辆进行控制。2.根据权利要求1所述的方法,其特征在于,所述S3中的根据所述待优化的控制策略、权重系数优化层以及控制策略优化层,得到优化后的控制策略,包括:S31、获取初始化的权重系数;设定k=1;S32、判断k是否大于n,如果k大于n,则转去执行S36,如果k小于或等于n,则执行S33;其中,n表示预设迭代次数;S33、基于所述控制策略优化层以及权重系数,对所述待优化的控制策略进行更新,得到更新后的控制策略;S34、基于所述权重系数优化层以及更新后的控制策略,对所述权重系数进行更新,得到更新后的权重系数;S35、根据所述更新后的权重系数,k=k+1,转去执行S32;S36、停止循环,输出优化后的控制策略。3.根据权利要求2所述的方法,其特征在于,所述S33中的基于所述控制策略优化层以及权重系数,对所述待优化的控制策略进行更新,得到更新后的控制策略,包括:S331、基于所述权重系数以及待优化的控制策略,构建最优控制问题;S332、将所述最优控制问题的期望作为控制策略更新的目标函数;S333、对所述目标函数进行最小化,得到更新后的控制策略。4.根据权利要求2所述的方法,其特征在于,所述S34中的基于所述权重系数优化层以及更新后的控制策略,对所述权重系数进行更新,得到更新后的权重系数,包括:S341、基于专家驾驶策略生成专家驾驶数据;S342、根据所述更新后的控制策略生成状态和控制轨迹;S343、基于所述专家驾驶数据以及所述状态和控制轨迹,构建损失函数;S344、对所述损失函数进行最小化,得到更新后的权重系数...
【专利技术属性】
技术研发人员:段京良,张发旺,马飞,陈良发,焦春绚,闫昊琪,曹星宇,许皓渊,肖礼明,
申请(专利权)人:北京科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。