当前位置: 首页 > 专利查询>深圳大学专利>正文

自动驾驶控制方法及装置制造方法及图纸

技术编号:29123098 阅读:49 留言:0更新日期:2021-07-02 22:17
本申请适用于智能驾驶领域,具体公开了一种自动驾驶控制方法及装置,在该方法中,获取车辆的当前车辆位移参数和交通参与对象的当前对象位移参数;基于所述当前车辆位移参数和所述当前对象位移参数,确定碰撞风险概率;如果所述碰撞风险概率超过所述风险阈值,则实施紧急制动操作;如果所述碰撞风险概率小于或等于所述风险阈值,则调用强化学习模型确定与所述当前车辆位移参数和所述当前对象位移参数相应的目标车辆操作信息,并按照所述目标车辆操作信息控制所述车辆进行操作。由此,同时保障了车辆在自动驾驶过程中的安全性和自动驾驶通行效率。

【技术实现步骤摘要】
自动驾驶控制方法及装置
本申请属于智能驾驶领域,尤其涉及一种自动驾驶控制方法及装置。
技术介绍
自动驾驶技术对于提升交通安全、提高交通效率以及提升驾驶体验方面具有至关重要的作用,并且联网自动驾驶车辆(automatedvehicle,AV)将在未来的智能交通系统(IntelligentTransportationSystem,ITS)中扮演重要角色。自动驾驶车辆技术中最基本的问题之一便是行人防撞问题,其要求自动驾驶车辆避免与交通参与者发生碰撞,关键之处就是如何恰当地权衡车辆的交通效率和其带来的碰撞安全风险。
技术实现思路
鉴于此,本申请实施例提供了一种自动驾驶控制方法及装置,以至少降低现有技术中自动驾驶车辆发生行人防撞事件的概率较高的问题。本申请实施例的第一方面提供了一种自动驾驶控制方法,包括:获取车辆的当前车辆位移参数和交通参与对象的当前对象位移参数;基于所述当前车辆位移参数和所述当前对象位移参数,确定碰撞风险概率;检测所述碰撞风险概率是否超过预设的风险阈值;如果所述碰撞风险概率超过风险阈值,则实施紧急制动操作;如果所述碰撞风险概率小于或等于所述风险阈值,则确定与所述当前车辆位移参数和所述当前对象位移参数相应的目标车辆操作信息,并按照所述目标车辆操作信息控制所述车辆进行操作。本申请实施例的第二方面提供了一种自动驾驶控制装置,包括:获取单元,被配置为获取车辆的当前车辆位移参数和交通参与对象的当前对象位移参数;计算单元,被配置为基于所述当前车辆位移参数和所述当前对象位移参数,计算在未干预车辆操作的情况下的碰撞风险概率;检测单元,被配置为检测所述碰撞风险概率是否超过预设的风险阈值;紧急制动单元,被配置为如果所述碰撞风险概率超过风险阈值,则实施紧急制动操作;操作单元,被配置为如果所述碰撞风险概率小于或等于所述风险阈值,则确定与所述当前车辆位移参数和所述当前对象位移参数相应的目标车辆操作信息,并按照所述目标车辆操作信息控制所述车辆进行操作。本申请实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。本申请实施例的第四方面提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备实现如上述方法的步骤。本申请实施例与现有技术相比存在的有益效果是:通过本申请实施例,车辆在自动驾驶系统集成了强化学习模型和碰撞风险监测模块,在碰撞风险概率过高时实施紧急制动,充分考虑了在利用强化学习模型输出车辆操作也无法避免碰撞风险的情况,保障了车辆在自动驾驶过程中的安全性,并能实现高效的自动驾驶通行效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了适于在本申请实施例中应用的一示例的强化学习模型的状态转移示意图;图2示出了根据本申请实施例的自动驾驶控制方法的一示例的流程图;图3示出了根据本申请实施例的确定碰撞风险概率的一示例的流程图;图4示出了图3中的步骤340在本申请实施例的一些示例中的具体实施流程图;图5示出了根据本申请实施例的计算车辆与行人之间的碰撞风险概率的一示例的原理示意图;图6示出了根据本申请实施例的基于马尔科夫决策过程的强化学习模型的一示例的训练框图;图7示出了根据本申请实施例的基于约束马尔科夫决策过程的强化学习模型的一示例的训练框图;图8示出了根据本申请实施例的自动驾驶控制装置的一示例的结构框图;图9是本申请实施例的电子设备的一示例的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。具体实现中,本申请实施例中描述的电子设备包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器)的计算机。在接下来的讨论中,描述了包括显示器和触摸敏感表面的电子设备。然而,应当理解的是,电子设备可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。可以在电子设备上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。图1示出了适于在本申请实施例中应用的一示例的强化学习模型的状态转移示意图。如图1所示,该状态转移示意图中涉及强化学习模型所对应的由多个环境状态f1~fn所组成的环境,在不同环境状态之间可能会发生状态转移,例如a1表示从f1到f2的状态转移动作,a2表示从f2到f1的状态转移动作,a3表示从f1到f3的状态转移动作,等等。这里,每个环境状态分别通过不同的状态转移动作集,以实现向相应环境状态的状态转移。在一些实施方式中,每一状态转移具有对应的奖赏,且各个奖赏可以是基于预设的奖赏函数来确定的。通常情况下,若奖赏越大,则可认为相应的状态转移越有价值。示例性地,针对状态f1,能够发生从状态本文档来自技高网...

【技术保护点】
1.一种自动驾驶控制方法,其特征在于,包括:/n获取车辆的当前车辆位移参数和交通参与对象的当前对象位移参数;/n基于所述当前车辆位移参数和所述当前对象位移参数,确定碰撞风险概率;/n检测所述碰撞风险概率是否超过预设的风险阈值;/n如果所述碰撞风险概率超过所述风险阈值,则实施紧急制动操作;/n如果所述碰撞风险概率小于或等于所述风险阈值,则调用强化学习模型确定与所述当前车辆位移参数和所述当前对象位移参数相应的目标车辆操作信息,并按照所述目标车辆操作信息控制所述车辆进行操作。/n

【技术特征摘要】
1.一种自动驾驶控制方法,其特征在于,包括:
获取车辆的当前车辆位移参数和交通参与对象的当前对象位移参数;
基于所述当前车辆位移参数和所述当前对象位移参数,确定碰撞风险概率;
检测所述碰撞风险概率是否超过预设的风险阈值;
如果所述碰撞风险概率超过所述风险阈值,则实施紧急制动操作;
如果所述碰撞风险概率小于或等于所述风险阈值,则调用强化学习模型确定与所述当前车辆位移参数和所述当前对象位移参数相应的目标车辆操作信息,并按照所述目标车辆操作信息控制所述车辆进行操作。


2.如权利要求1所述的方法,其特征在于,所述位移参数包括位置信息,
其中,所述基于所述当前车辆位移参数和所述当前对象位移参数,确定碰撞风险概率,包括:
基于所述交通参与对象的位置信息和所述车辆的位置信息,确定所述交通参与对象与所述车辆之间的相对距离;
如果所述相对距离大于预设的距离阈值,则确定无碰撞风险;
如果所述相对距离小于或等于所述距离阈值,则基于所述当前车辆位移参数和所述当前对象位移参数确定碰撞风险概率。


3.如权利要求2所述的方法,其特征在于,所述位移参数还包括速度信息和方向信息,以及所述车辆位移参数还包括车辆尺寸信息,
其中,所述如果所述相对距离小于或等于所述距离阈值,则基于所述当前车辆位移参数和所述当前对象位移参数确定碰撞风险概率,包括:
如果所述相对距离小于或等于所述距离阈值,则基于所述交通参与对象的位置信息、所述车辆的位置信息和所述车辆尺寸信息,计算所述交通参与对象与所述车辆的边缘之间的第一相对角度;
基于所述交通参与对象的速度信息和方向信息连同所述车辆的速度信息和方向信息,推算在经过预设时间之后所述交通参与对象与所述车辆的边缘之间的第二相对角度;
基于所述第一相对角度与所述第二相对角度之间的重合角度计算在方向上的第一冲突风险概率,以及基于所述相对距离、交通参与对象的速度信息和所述车辆的速度信息计算在距离上的第二冲突风险概率;
基于所述第一冲突风险概率和所述第二冲突风险概率,确定碰撞风险概率。


4.如权利要求1-3中任一项所述的方法,其特征在于,所述调用强化学习模型确定与所述当前车辆位移参数和所述当前对象位移参数相应的目标车辆操作信息,包括:
从强化学习模型的各个环境状态中确定与所述当前车辆位移参数和所述当前对象位移参数匹配的当前环境状态,并根据动作策略从所述当前环境状态所对应的目标车辆操作信息集中确定对应奖赏最大化的目标车辆操作信息;其中,所述强化学习模型的所述各个环境状态分别是由相应的车辆位移参数和对象位移参数定义的,所述各个环境状态分别具有由...

【专利技术属性】
技术研发人员:邹广源贺颖陈龙权潘微科
申请(专利权)人:深圳大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1