当前位置: 首页 > 专利查询>李昊专利>正文

一种基于LightGBM的地铁路径规划方法技术

技术编号:25686930 阅读:56 留言:0更新日期:2020-09-18 20:59
本发明专利技术公开了一种基于LightGBM的地铁路径规划方法,使用Scrapy‑Redis爬虫爬取网页数据得到原始数据集;通过编码各地铁站、将实际线路抽象为有向无环图,得到地铁各路径的客流量与时间关系数据集;通过在数据集上训练LightGBM模型,得到客流量影响时间消耗的时间预测模型;通过在数据集上使用Dijkstra算法最短路径搜索,使用最小堆加快算法速度,得到Dijkstra算法评估函数权值;通过统计评估函数权值分布情况,得到站间距离的时间消耗预测模型;通过将上述两个模型结果加权整合,得到最优路径推荐结果;通过百度API接口,建立用户友好的图形界面展示路径结果。本发明专利技术具有很强的实用性和可推广性。

【技术实现步骤摘要】
一种基于LightGBM的地铁路径规划方法
本专利技术涉及交通智能交互
,具体涉及一种基于LightGBM的地铁路径规划方法。
技术介绍
城市轨道交通系统作为城市的运输动脉,其网络系统越来越复杂,如何在复杂网络中规划合理的出行最优路径一直是研究热点。随着图论及相关计算机算法的快速发展,通过将实际地理信息转换成无向无环图,设计搜索算法从而规划最佳路径是常见的处理方式。该方法在处理地铁路径优选时遇到了新问题,因为地铁运行时长不仅仅依赖于站台间距以及地铁运行速度,也与站台上的乘客密度、车厢中的乘客数量密切相关,这些因素都会对路径优选产生直接影响。因此,单纯采用权重为物理距离的搜索算法进行路径优选存在局限性。另外,在现有产品应用层面,如高德、百度,其公司产品已经实现了大数据、大规模、动态实时查询等功能,优选模型也具有较高的精度,但需要巨量的数据支撑,需要在城市地铁站建立实时的乘客流量统计系统,需要消耗大量的运算资源,所以系统实现的成本极高。同时,这些产品一旦与云端服务器失去连接(此情况在地铁系统中经常出现),用户将只能得到离线的基于路径长度的线路推荐,准确率将大大降低。
技术实现思路
针对上述
技术介绍
中提及的地铁出行路径最优规划方法存在的问题,本专利技术的目的是提供一种基于LightGBM的地铁路径规划方法,该方法实现成本较低,并且精度大大高于传统地图APP的离线测算方法。本专利技术为实现上述目的采用的技术方案是:一种基于LightGBM的地铁路径规划方法,其特征在于,包括:S1、获取原始数据集,并对原始数据集进行预处理;所述原始数据集包含用户进站时间、入口站名、用户出站时间及出口站名;S2、对预处理后的原始数据集进行格式转化处理,以获得地铁各路径的客流量与时间关系数据集;S3、基于地铁各路径的客流量与时间关系数据集,以用户起终点站位置与总路程时间数据作为LightGBM模型的训练集,利用LightGBM模型进行训练,以训练生成客流量影响时间消耗的时间预测模型;S4、在地铁各路径的客流量与时间关系数据集上利用Dijkstra算法进行最短路径搜索,并使用最小堆数据结构优化Dijkstra算法,得到Dijkstra算法评估函数权值;S5、通过统计Dijkstra算法评估函数权值分布情况,得到站间距离的时间消耗预测模型;S6、将人流量影响时间消耗的时间预测模型和站间距离的时间消耗预测模型进行加权整合,得到最优路径评估函数,并根据最优路径评估函数,得到最优路径,生成路径规划。所述的基于LightGBM的地铁路径规划方法,其特征在于,还包括:通过百度开源API接口,建立用户图形界面,用于展示最优路径。进一步,所述原始数据集是利用Scrapy-Redis框架的爬虫程序爬取指定网页数据,搜索官网发布的地铁数据形成的数据集。进一步,所述对原始数据集进行预处理包括:根据现有地铁建造情况,预设触发条件,过滤原始数据集中的无效数据。进一步,所述对预处理后的原始数据集进行格式转化处理包括:将各地铁站字符串名称编码为数字编号,将小时分钟秒形式的时间信息转换成以秒为单位的int数值,将实际地铁线路抽象为有向无环图。进一步,所述最优路径评估函数为:其中begin为用户起始位置,end为用户终止位置,time(begin,end)为用户从起始位置到终止位置所耗时间,LightGBM()函数为训练得到的客流量影响时间消耗的时间预测模型,length(begin,end)为用户起始站到用户终止站的物理距离,V(subway)为地铁平均时速,k1和k2均为权重因子。进一步,所述预设触发条件包括:未运营地铁站以及无效用户数据;所述无效用户数据包括进站时间晚于出站时间或用户进出站消耗时间过长。通过上述设计方案,本专利技术可以带来如下有益效果:本专利技术应用LightGBM,可以在微数据集下以较高迭代速度建立时间预测模型,并且模型准确率较高。使用最小堆数据结构存储Dijkstra最短路径算法的数据,可极大减小算法时间复杂度。同时,本专利技术分别从站台间物理距离(显变量)和客流密度两方面对备选路径进行评估,可以提供更精确的比较和描述。因此,本专利技术的方法可以更好的达到评价目的。进一步,本专利技术使用Scrapy-Redis分布式爬虫框架全自动化从官网搜集地铁数据,节约数据搜集时间成本、便于模型定期更新,因此,本专利技术具有很强的实用性和可推广性。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术示意性实施例及其说明用于理解本专利技术,并不构成本专利技术的不当限定,在附图中:图1是本专利技术一实施例提供的基于LightGBM的地铁路径规划方法的流程示意图。图2是本专利技术中Scrapy-Redis框架的逻辑关系图。图3a是本专利技术一实施例中最小堆维护流程局部示意图一。图3b是本专利技术一实施例中最小堆维护流程局部示意图二。图3c是本专利技术一实施例中最小堆维护流程局部示意图三。图3d是本专利技术一实施例中最小堆维护流程局部示意图四。图3e是本专利技术一实施例中最小堆维护流程局部示意图五。具体实施方式为了更清楚地说明本专利技术,下面结合优选实施例和附图对本专利技术做进一步的说明。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本专利技术的保护范围。本专利技术设计了一种基于LightGBM的地铁路径规划方法,图1为本专利技术所述的基于LightGBM的地铁路径规划方法实施实例流程示意图。本实施例以北京市地铁路径规划问题为例进行阐述,基于LightGBM的地铁路径规划方法包括如下步骤:步骤S1:利用Scrapy-Redis框架的爬虫程序爬取指定网页数据,搜索官网发布的地铁数据,得到原始数据集;所述原始数据集包含用户进站时间、入口站名、用户出站时间及出口站名;如图2所示,Scrapy-Redis框架的爬虫程序是一种根据制定规则自动提取网页的程序或脚本,可全自动收集、分析、过滤、储存数据,基于python中的beautifulSoup、requests、Scrapy等技术进行网页操作相关库,同时引入Redis分布式架构;具体的,本专利技术采用的Scrapy-Redis框架由四个重要模块组成:①Scheduler(等待爬取URL队列调度器):Scrapy-Redis框架使用Redis队列替代原有的爬取队列,该Redis队列可供多个spider同时读取;②DuplicationFilter(去重器):由于Redis中set(集合)结构自动过滤重复元素,去重器在接收到request后提取数据特征并输入set(集合)查看是否重复,并将不重复request放入Redis队列;③BaseSpider(Scrapy-Redis框架爬取器):继承了Spider/ReidsMixin类的RedisSpider架构,非常适合与Redis数本文档来自技高网...

【技术保护点】
1.一种基于LightGBM的地铁路径规划方法,其特征在于,包括:/nS1、获取原始数据集,并对原始数据集进行预处理;所述原始数据集包含用户进站时间、入口站名、用户出站时间及出口站名;/nS2、对预处理后的原始数据集进行格式转化处理,以获得地铁各路径的客流量与时间关系数据集;/nS3、基于地铁各路径的客流量与时间关系数据集,以用户起终点站位置与总路程时间数据作为LightGBM模型的训练集,利用LightGBM模型进行训练,以训练生成客流量影响时间消耗的时间预测模型;/nS4、在地铁各路径的客流量与时间关系数据集上利用Dijkstra算法进行最短路径搜索,并使用最小堆数据结构优化Dijkstra算法,得到Dijkstra算法评估函数权值;/nS5、通过统计Dijkstra算法评估函数权值分布情况,得到站间距离的时间消耗预测模型;/nS6、将客流量影响时间消耗的时间预测模型和站间距离的时间消耗预测模型进行加权整合,得到最优路径评估函数,并根据最优路径评估函数,得到最优路径,生成路径规划。/n

【技术特征摘要】
1.一种基于LightGBM的地铁路径规划方法,其特征在于,包括:
S1、获取原始数据集,并对原始数据集进行预处理;所述原始数据集包含用户进站时间、入口站名、用户出站时间及出口站名;
S2、对预处理后的原始数据集进行格式转化处理,以获得地铁各路径的客流量与时间关系数据集;
S3、基于地铁各路径的客流量与时间关系数据集,以用户起终点站位置与总路程时间数据作为LightGBM模型的训练集,利用LightGBM模型进行训练,以训练生成客流量影响时间消耗的时间预测模型;
S4、在地铁各路径的客流量与时间关系数据集上利用Dijkstra算法进行最短路径搜索,并使用最小堆数据结构优化Dijkstra算法,得到Dijkstra算法评估函数权值;
S5、通过统计Dijkstra算法评估函数权值分布情况,得到站间距离的时间消耗预测模型;
S6、将客流量影响时间消耗的时间预测模型和站间距离的时间消耗预测模型进行加权整合,得到最优路径评估函数,并根据最优路径评估函数,得到最优路径,生成路径规划。


2.根据权利要求1所述的基于LightGBM的地铁路径规划方法,其特征在于,还包括:通过百度开源API接口,建立用户图形界面,用于展示最优路径。


3.根据权利要求1所述的基于LightGBM的地铁路径规划方法,其特征在于:所述原始数据集是利用Scrapy-Red...

【专利技术属性】
技术研发人员:李昊戚书宁付天悦
申请(专利权)人:李昊
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1