提供车辆导航模拟环境的方法和装置制造方法及图纸

技术编号：26734454 阅读：31 留言：0更新日期：2020-12-15 14:42

一种方法可以包括递归地执行：(1)向模拟车辆提供模拟环境的一个或多个状态，并且所述状态包括模拟车辆的第一当前时间和第一当前位置；以及(2)当所述模拟车辆达到里程碑时，获得所述模拟车辆的动作，其中：所述动作包括：在所述模拟车辆的所述第一当前位置等待，在乘客组A的运输起点接载乘客组A，并在乘客组B的运输目的地放下乘客组B，所述里程碑是任何乘客组的运输的起点或终点；(3)确定对所述动作的所述模拟车辆的奖励；(4)基于所述动作来更新一个或多个所述状态，以获得用于提供给所述模拟车辆的一个或多个更新状态。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】提供车辆导航模拟环境的方法和装置优先权信息本申请要求于2018年5月3日提交的题为“MethodandDeviceforProvidingVehicleNavigationSimulationEnvironment”(提供车辆导航模拟环境的方法和装置)的美国非临时申请号15/970,414的优先权的权益，其内容通过引用合并于此。
本申请一般涉及用于提供车辆导航模拟环境以及提供车辆导航的方法和装置。
技术介绍
车辆调度平台可以自动将运输请求分配给相应的车辆以提供运输服务。运输服务可以包括运输单个乘客/乘客组或多个乘客/乘客组拼车。每个车辆司机提供的运输服务均会得到奖励。对于车辆司机来说，重要的是最大化他们在街上花费时间的奖励。
技术实现思路
本申请的各种实施例可以包括：用于提供车辆导航模拟环境的系统、方法和非暂时性计算机可读介质。根据一个方面，一种用于提供车辆导航模拟环境的示例性方法可以包括，在一段时间内递归执行步骤(1)-(4)：(1)向模拟主体提供模拟环境的一个或多个状态，其中：所述模拟主体包括模拟车辆，以及，所述状态包括模拟车辆的第一当前时间和第一当前位置；(2)当所述模拟车辆达到里程碑时，获得所述模拟车辆的动作，其中：所述动作包括：在所述模拟车辆的所述第一当前位置处等待，在乘客组A的运输起点处接载乘客组A，并在乘客组B的运输目的地放下乘客组B，所述乘客组A和乘客组B各自包含一个或多个乘客，并且所述里程碑是任何乘客组的运输的起点或终点；(3)确定对所述动作的所述模拟车辆奖励；以...

【技术保护点】
1.一种提供车辆导航模拟环境的方法，包括，在一段时间内递归执行步骤(1)-(4)：/n(1)向模拟主体提供模拟环境的一种或多种状态，其中：/n所述模拟主体包括模拟车辆，以及/n所述状态包括所述模拟车辆的第一当前时间和第一当前位置；/n(2)当所述模拟车辆达到里程碑时，获得所述模拟车辆的动作，其中：/n所述动作包括：在所述模拟车辆的所述第一当前位置等待，在乘客组A的运输起点处接载乘客组A，并在乘客组B的运输目的地放下乘客组B，/n所述乘客组A和所述乘客组B各自包含一个或多个乘客，并且/n所述里程碑是任何乘客组的运输的起点或终点；/n(3)确定对所述动作的所述模拟车辆的奖励；以及/n(4)基于所述动作来更新一个或多个所述状态，以获得用于提供给所述模拟车辆的一个或多个更新状态，其中，所述更新状态包括所述模拟车辆的第二当前时间和第二当前位置。/n

【技术特征摘要】
【国外来华专利技术】20180503 US 15/970,4141.一种提供车辆导航模拟环境的方法，包括，在一段时间内递归执行步骤(1)-(4)：
(1)向模拟主体提供模拟环境的一种或多种状态，其中：
所述模拟主体包括模拟车辆，以及
所述状态包括所述模拟车辆的第一当前时间和第一当前位置；
(2)当所述模拟车辆达到里程碑时，获得所述模拟车辆的动作，其中：
所述动作包括：在所述模拟车辆的所述第一当前位置等待，在乘客组A的运输起点处接载乘客组A，并在乘客组B的运输目的地放下乘客组B，
所述乘客组A和所述乘客组B各自包含一个或多个乘客，并且
所述里程碑是任何乘客组的运输的起点或终点；
(3)确定对所述动作的所述模拟车辆的奖励；以及
(4)基于所述动作来更新一个或多个所述状态，以获得用于提供给所述模拟车辆的一个或多个更新状态，其中，所述更新状态包括所述模拟车辆的第二当前时间和第二当前位置。

2.根据权利要求1所述的方法，其特征在于：
仅当所述模拟车辆上没有乘客时，所述模拟车辆才执行在所述模拟车辆的所述第一当前位置等待的动作；以及
当所述模拟车辆上的乘客达到最大容量时，所述模拟车辆仅执行在所述乘客组B的所述运输目的地放下所述乘客组B的动作。

3.根据权利要求1所述的方法，其特征在于：
如果所述动作为在所述模拟车辆的当前位置等待，所述第二当前时间为与所述第一当前时间加上时间段对应的当前时间，所述第二当前位置与所述第一当前位置相同；以及
如果所述动作为在所述乘客组A的运输起点处接载所述乘客组A，则所述第二当前时间是与接载所述乘客组A对应的当前时间，所述第二当前位置是所述乘客组A的运输起点；以及
如果所述动作为在所述乘客组B的所述运输目的地放下所述乘客组B，则所述第二当前时间是与放下所述乘客组B对应的当前时间，所述第二当前位置是所述乘客组B的运输目的地。

4.根据权利要求1所述的方法，其特征在于：
在所述第一当前时间，在所述模拟车辆根据请求接收的所有乘客组的所有运输起点中，所述乘客组A的运输起点最接近所述第一当前位置；以及
在所述第一当前时间，所述模拟车辆上所有乘客组的所有运输目的地中，所述乘客组B的运输目的地最接近所述第一当前位置。

5.根据权利要求1所述的方法，其特征在于，确定对所述动作的所述模拟车辆的所述奖励，包括：
确定在所述第一当前位置处等待的所述模拟车辆的所述奖励为零；
确定在所述乘客组A的所述运输起点处接载所述乘客组A的所述模拟车辆的所述奖励为零；以及
根据从所述乘客组B的所述运输起点到所述乘客组B的运输目的地的理论行驶距离，确定所述模拟车辆在所述乘客组B的运输目的地放下所述乘客组B的所述奖励。

6.根据权利要求1所述的方法，其特征在于：
在所述乘客组A的运输起点接载所述乘客组A的所述动作包括：在所述模拟车辆上载有第一乘客组的情况下，接载第二乘客组；
运送所述第一乘客组和所述第二乘客组所花费的时间总和最小：(路线选项1)乘客总额外乘车时间和(路线选项2)的乘客总额外乘车时间；
所述(路线选项1)包括：接载所述第二乘客组、放下所述乘客组P、放下所述第二乘客组；
所述(路线选项2)包括：接载所述第二乘客组、放下所述第二乘客组、放下所述第一乘客组；
与一组接一组运输且不拼车相比，当所述模拟车辆按照所述(路线选项1)运输时，所述(路线选项1)的所述乘客总额外乘车时间是所述第一乘客组和所述第二乘客组所花费的额外时间的总和；以及
与一组接一组运输且不拼车相比，当所述模拟车辆按照所述(路线选项2)运输时，所述(路线选项2)的所述乘客总额外乘车时间是所述第一乘客组和第二乘客组所花费的额外时间的总和。

7.根据权利要求6所述的方法，还包括：
如果所述(路线选项1)的所述乘客总额外乘车时间小于所述(路线选项2)的所述乘客总额外乘车时间，则分配所述模拟车辆采用所述(路线选项1)；以及
如果所述(路线选项1)的所述乘客总额外乘车时间大于所述(路线选项2)的所述乘客总额外乘车时间，则分配所述模拟车辆采用所述(路线选项2)。

8.根据权利要求1所述的方法，其特征在于：
基于历史旅客群体的旅行历史数据，递归执行步骤(1)-(4)训练可在该时间段内最大化累积奖励的策略；以及
经训练的策略确定了在真实环境中针对真实车辆的动作，所述在真实环境中针对所述真实车辆的动作选自：
(动作1)在所述真实车辆的当前位置等待，
(动作2)接载乘客组，以及
(动作3)放下乘客组。

9.根据权利要求8所述的方法，其特征在于，如果车上有两个或以上乘客组，则所述经训练的策略还确定在所述真实车辆上乘客组下车的顺序。

10.一种非暂时性计算机可读存储介质，当由一个或多个处理器执行时，所述存储指令使一个或多个处理器执行一种用于提供车辆导航模拟环境的方法，所述方法包括在一段时间内递归执行步骤(1)-(4)：
(1)向模拟主体提供模拟环境的一种或多种状态，其中：
所述模拟主体包括模拟车辆，以及
所述状态包括所述模拟车辆的第一当前时间和第一当前位置；
(2)当所述模拟车辆达到里程碑时，获得所述模拟车辆的动作，其中：
所述动作包括：在所述模拟车辆的所述第一个当前位置等待，在乘客组A的运输起点处接载乘客组A，并在乘客组B的运输目的地放下乘客组B，
所述乘客组A和所述乘客B各自包含一个或多个乘客，并且
所述里程碑是任何乘客组运输的起点或终点；
(3)确定对所述动作的所述模拟车辆的奖励；以及
(4)基于所述动作更新一个或多个所述状态，以获得用于提供给所述模拟车辆的一个或多个更新状态，其中，所述更新状态包括所述模拟车辆的第二当前时间和第二当前位置...

【专利技术属性】
技术研发人员：秦志伟，伊杉·金达尔，陈学文，
申请(专利权)人：北京嘀嘀无限科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人