目标对象的移动控制方法、装置、设备及介质制造方法及图纸

技术编号：40258337 阅读：14 留言：0更新日期：2024-02-02 22:49

本公开提供了一种目标对象的移动控制方法、装置、设备、介质、程序产品和自动驾驶车辆，可以应用于人工智能和自动驾驶技术领域。根据第t时刻目标对象所处的目标场景，确定与目标场景相对应的目标智能体，其中，目标智能体是基于样本对象在目标场景下的样本属性信息训练得到的；根据目标对象移动的第一移动目标，确定目标参考线，其中，目标参考线上具有多个路径点；将多个路径点和目标对象在目标场景下的属性信息输入第一目标网络，输出第t时刻的下一时刻第t+1时刻目标对象所在的目标路径点；将属性信息和在目标路径点时目标对象的第一基准速度输入第二目标网络，输出目标速度；以及基于目标路径点和目标速度，控制目标对象的移动。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能和自动驾驶，尤其涉及目标对象的移动控制方法、装置、设备、介质、程序产品和自动驾驶车辆。

技术介绍

1、随着科技的发展以及人们生活水平的提高，自动驾驶技术作为当前新兴的技术，人们对无人驾驶车辆(简称无人车)的需求越来越大，应用于无人车的决策规划技术得到了关注。

2、在实施本公开的过程中发现，现有决策规划中，行为决策模块输出具体的驾驶行为，路径规划模块根据驾驶行为和周围环境信息输出一条符合安全、交通法规等规则的轨迹，最后控制模块执行该轨迹。路径规划模块与行为决策模块互相配合，保证了无人车轨迹平滑，但行为决策模块的作用被弱化了，处理障碍物、交通法规等具体问题都要在路径规划模块完成，导致运算时间偏长。

技术实现思路

1、鉴于上述问题，本公开提供了一种目标对象的移动控制方法、装置、设备、介质、程序产品和自动驾驶车辆。

2、根据本公开的第一个方面，提供了一种目标对象的移动控制方法，包括：

3、根据第t时刻目标对象所处的目标场景，确定与目标场景相对应的目标智能体，其中，目标智能体是基于样本对象在目标场景下的样本属性信息训练得到的，目标智能体包括第一目标网络和第二目标网络；

4、根据目标对象移动的第一移动目标，确定目标参考线，其中，目标参考线上具有多个路径点；

5、将多个路径点和目标对象在目标场景下的属性信息输入第一目标网络，输出第t时刻的下一时刻第t+1时刻目标对象所在的目标路径点；

6、将属性信息和在目标

7、基于目标路径点和目标速度，控制目标对象的移动。

8、根据本公开的实施例，目标对象的移动控制方法还包括：

9、在确定目标对象在移动过程中发生故障的情况下，停止对目标对象的移动控制。

10、根据本公开的实施例，目标对象的移动控制方法还包括：

11、在控制目标对象的移动的过程中，获取目标对象的第一移动状态信息以及目标场景下除目标对象之外其他对象的第二移动状态信息；

12、根据目标路径点、目标速度、第一移动状态信息和第二移动状态信息，确定目标对象与其他对象的相遇时间；

13、在确定相遇时间小于阈值的情况下，确定目标对象在移动过程中发生故障。

14、根据本公开的实施例，第一目标网络是利用第一目标函数和价值网络训练第一策略网络后得到的；第二目标网络是利用第二目标函数和价值网络训练第二策略网络后得到的；

15、目标对象的移动控制方法还包括：

16、根据样本对象移动的第二移动目标，确定样本参考线，其中，样本参考线上具有多个样本路径点；

17、根据预设条件，从多个样本路径点中确定样本路径点集；

18、确定训练回合的次数和每个训练回合的训练步数；

19、针对每个训练回合的每个训练步数重复执行以下操作：

20、将在目标场景下的样本属性信息和样本路径点集中的样本路径点，输入初始化的第一策略网络，输出初始路径点；

21、将样本属性信息和在样本路径点时样本对象的第二基准速度，输入初始化的第二策略网络，输出初始速度；

22、将初始路径点和初始速度输入初始化的价值网络，输出控制样本对象移动过程中的奖励值；

23、在确定奖励值不超过阈值的情况下，根据第一目标函数，更新第一策略网络的参数，在确定更新次数达到第一预设更新次数的情况下为止，得到第一目标网络；

24、在确定奖励值不超过阈值的情况下，根据第二目标函数，更新第二策略网络的参数，在确定更新次数达到第一预设更新次数的情况下为止，得到第二目标网络。

25、根据本公开的实施例，基于目标路径点和目标速度，控制目标对象的移动，包括：

26、根据目标路径点、目标速度和追踪算法，确定移动指令；

27、根据移动指令，控制目标对象的移动。

28、根据本公开的实施例，目标对象在目标场景下的属性信息包括：目标对象的速度信息、目标对象的移动角度信息、与车道相关联的信息以及目标对象与各个路径点的相对位置信息；

29、其中，将多个路径点和目标对象在目标场景下的属性信息输入第一目标网络，输出第t时刻的下一时刻第t+1时刻目标对象所在的目标路径点，包括：

30、将多个路径点和目标对象在目标场景下的属性信息输入第一目标网络，以便执行以下操作：

31、根据目标场景，确定目标对象所在车道的周围的车道数量；

32、根据车道数量、多个路径点以及目标对象与各个路径点的相对位置信息，确定每个车道上分配的路径点；

33、根据目标对象的速度信息、目标对象的移动角度信息、与车道相关联的信息以及每个车道上分配的路径点，输出目标路径点。

34、根据本公开的实施例，将属性信息和在目标路径点时目标对象的第一基准速度输入第二目标网络，输出目标速度，包括：

35、将属性信息和在目标路径点时目标对象的第一基准速度输入第二目标网络，以便执行以下操作：

36、根据目标对象的速度信息、目标对象的移动角度信息、与车道相关联的信息以及每个车道上分配的路径点，预测得到目标对象在目标路径点时的预测速度；

37、根据预测速度和第一基准速度，输出目标速度。

38、根据本公开的实施例，在确定目标场景为道路场景的情况下，与车道相关联的信息包括用于表征目标对象所在车道的可换道情况；

39、在确定目标场景为路口场景的情况下，与车道相关联的信息包括用于表征第t时刻下目标对象与路口之间的距离信息；

40、在确定目标场景为道路合并与分离场景的情况下，与车道相关联的信息包括用于表征第t时刻下目标对象与汇入点或驶出点之间的距离信息。

41、本公开的第二方面提供了一种目标对象的移动控制装置，包括：

42、第一确定模块，用于根据第t时刻目标对象所处的目标场景，确定与目标场景相对应的目标智能体，其中，目标智能体是基于样本对象在目标场景下的样本属性信息训练得到的，目标智能体包括第一目标网络和第二目标网络；

43、第二确定模块，用于根据目标对象移动的第一移动目标，确定目标参考线，其中，目标参考线上具有多个路径点；

44、第一处理模块，用于将多个路径点和目标对象在目标场景下的属性信息输入第一目标网络，输出第t时刻的下一时刻第t+1时刻目标对象所在的目标路径点；

45、第二处理模块，用于将属性信息和在目标路径点时目标对象的第一基准速度输入第二目标网络，输出目标速度，其中，目标速度是目标对象在目标路径点时的速度；以及

46、第一控制模块，用于基于目标路径点和目标速度，控制目标对象的移动。

47、本公开的第三方面提供了一种电子设备，本文档来自技高网...

【技术保护点】

1.一种目标对象的移动控制方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求2所述的方法，还包括：

4.根据权利按要求1～3任一项所述的方法，其中，所述第一目标网络是利用第一目标函数和价值网络训练第一策略网络后得到的；所述第二目标网络是利用第二目标函数和所述价值网络训练第二策略网络后得到的；

5.根据权利要求1～3任一项所述的方法，其中，所述基于所述目标路径点和所述目标速度，控制所述目标对象的移动，包括：

6.根据权利要求1所述的方法，其中，所述目标对象在所述目标场景下的属性信息包括：所述目标对象的速度信息、所述目标对象的移动角度信息、与所述车道相关联的信息以及所述目标对象与各个所述路径点的相对位置信息；

7.根据权利要求6所述的方法，其中，所述将所述属性信息和在所述目标路径点时所述目标对象的第一基准速度输入所述第二目标网络，输出目标速度，包括：

8.根据权利要求6所述的方法，其中，

9.一种目标对象的移动控制装置，包括：

10.一种电子设备，包括：p>

11.一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器实现权利要求1至8中任一项所述的方法。

12.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。

13.一种自动驾驶车辆，包括权利要求10所述的电子设备。

...

【技术特征摘要】

1.一种目标对象的移动控制方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求2所述的方法，还包括：

5.根据权利要求1～3任一项所述的方法，其中，所述基于所述目标路径点和所述目标速度，控制所述目标对象的移动，包括：

6.根据权利要求1所述的方法，其中，所述目标对象在所述目标场景下的属性信息包括：所述目标对象的速度信息、所述目标对象的移动角度信息、与所述车道相关联的信息以及所述目标对象...

【专利技术属性】
技术研发人员：王渤谦，
申请(专利权)人：北京京东远升科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人