一种基于逆强化学习的货车路径选择分析方法技术

技术编号：40228248 阅读：6 留言：0更新日期：2024-02-02 22:31

本发明专利技术公开了一种基于逆强化学习的货车路径选择分析方法，首先获取城市路网数据、城市POI数据和货车GPS轨迹数据；之后从货车轨迹中识别货车的OD点，并将OD点与POI点匹配从而获得行程的目的信息，并将货车轨迹匹配到路网，获得货车行程所经路段序列，之后基于逆强化学习构建货车路径选择模型并对模型进行训练，最后基于路径选择模型进行货车路径选择，并基于路径选择结果进行可解释分析。本发明专利技术的方案以城市路网数据、城市POI数据和货车GPS轨迹数据作为输入，采用生成对抗模仿学习(GAIL)进行建模分析，能够在大路网下平稳收敛；以轨迹数据作为驱动，能够得到更贴合实际的结果，在保障精度的同时满足与统计模型相似的行为解释要求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于货车路径选择领域，具体涉及一种基于逆强化学习的货车路径选择分析方法。

技术介绍

1、近年来，因交通管理部门的管理需要，我国货车基本实现了定位系统的全覆盖，同时在网络业务的发展下产生了货拉拉等在线货运服务平台，通过货车驾驶员手机应用等对货车进行定位。定位、无线通信技术和物联网的飞速发展使得全程、实时、精确定位货车成为可能，海量的货车时空轨迹数据得以产生并被保存，成为了研究货车运输的重要数据来源，从而为研究货车路径选择建模、运行特征分析等提供数据支持。通过对货车驾驶员路径选择行为进行建模分析，能够深入理解其路径选择的影响因素和偏好，为货车调度管理安排、货运规划提供支持。

2、传统路径选择建模多采用经典离散选择模型(discrete choice model，dcm)，在大型路网和大量数据下这些统计模型往往面临选择集生成困难、难以收敛等问题。近年来，神经网络和深度学习的快速发展为dcm提供了更多的可替代模型以应对上述问题，其中逆强化学习(inverse reinforcement learning，irl)基于马尔可夫决策过程，与动态dcm(dynamic discrete choice model，ddcm)有着相似的结果，使得其能够运用在路径选择建模中。现有的研究表明，引入行为奖励网络通过逆强化学习算法进行选择建模，不仅能保证预测精度，对奖励网络的分析同样可以满足与传统统计模型相类似的行为解释要求。基于马尔可夫决策过程建立强化学习框架，利用逆强化学习进行货车路径选择行为建模，可用于预测货车的行驶路线并对不

技术实现思路

1、针对上述问题，本专利技术的目的在于提供一种基于逆强化学习的货车路径选择分析方法，以城市路网数据、城市poi数据和货车gps轨迹数据作为输入，采用生成对抗模仿学习(gail)进行建模分析，能够在保障精度的同时满足与统计模型相似的行为解释要求。

2、实现本专利技术目的的具体技术方案为：

3、一种基于逆强化学习的货车路径选择分析方法，包括以下步骤：

4、步骤1、获取城市路网数据、城市poi数据和货车gps轨迹数据；

5、步骤2、从货车轨迹中识别货车的od点，并将od点与poi点匹配从而获得行程的目的信息；

6、步骤3、将货车轨迹匹配到路网，获得货车行程所经路段序列；

7、步骤4、基于逆强化学习构建货车路径选择模型，以步骤1至步骤3获取的货车行程信息作为模型的输入，对模型进行训练；

8、步骤5、基于步骤4训练后的路径选择模型进行货车路径选择，并基于路径选择结果进行可解释分析。

9、与现有技术相比，本专利技术的有益效果在于：

10、(1)本专利技术的方案构建了一种面向货车的动态路径选择模型，能够在大路网下平稳收敛；以轨迹数据作为驱动，能够得到更贴合实际的结果；从全局和局部两个层面进行分析，全方位理解货车的路径选择行为；

11、(2)本专利技术的方案引入行为奖励网络通过逆强化学习算法进行选择建模，不仅能保证预测精度，对奖励网络的分析同样可以满足与传统统计模型相类似的行为解释要求，同时本专利技术基于马尔可夫决策过程建立强化学习框架，利用逆强化学习进行货车路径选择行为建模，可用于预测货车的行驶路线并对不同环境下的驾驶行为进行分析。

12、下面结合具体实施方式对本专利技术做进一步的说明。

本文档来自技高网...

【技术保护点】

1.一种基于逆强化学习的货车路径选择分析方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤1中的城市路网数据包括但不限于高速数据、主干道数据与次干道数据；

3.根据权利要求1所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤2中的匹配具体为：

4.根据权利要求1所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤4中的逆强化学习构建货车路径选择模型，具体为：

5.根据权利要求4所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤4-2中的货车路径选择模型(生成对抗模仿学习模型GAIL模型)，具体为：

6.根据权利要求1所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤5中的路径选择以及分析，具体为：

7.根据权利要求6所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤5-2中的路径选择结果分析，具体为：

8.一种基于逆强化学习的货车路径选择分析系统，其特征在于，包括以下模块：

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-7之任一所规定的方法步骤。

10.一种储存有计算机程序的计算机可存储介质，其特征在于，在该计算机程序上由处理器来实现如上述1至7之任一所规定的方法步骤。

...

【技术特征摘要】

1.一种基于逆强化学习的货车路径选择分析方法，其特征在于，包括以下步骤：

3.根据权利要求1所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤2中的匹配具体为：

4.根据权利要求1所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤4中的逆强化学习构建货车路径选择模型，具体为：

5.根据权利要求4所述的基于逆强化学习的货车路径选择分析方法，其特征在于，所述步骤4-2中的货车路径选择模型(生成对抗模仿学习模型gail模型)，具体为：

【专利技术属性】
技术研发人员：朱治邦，孙婧，李大韦，陈千卓，张桐，范甬辰，
申请(专利权)人：华设设计集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人