一种全天时全路网的交通流量估计方法技术

技术编号:33472287 阅读:23 留言:0更新日期:2022-05-19 00:49
本发明专利技术公开了一种全天时全路网的交通流量估计方法,包括以下步骤:建立和训练城市全路网基础交通流量模拟模型;对交通流量模拟进行基于统计分析的异常处理;建立交通态势路网匹配模型,提取路网的实时交通态势信息;分析发现交通态势和交通流量之间的对应关系,建立应用该对应关系的基础流量修正模型,得到修正流量;引入辅助信息,与监测卡口数据作对比分析,建立交通流量的辅助信息影响模型,并对得到的交通流量进行修正。本发明专利技术的优点是:可获取全天时小时分辨率且覆盖研究区域全范围的交通流量数据资料,满足了机动车排放清单不间断大范围的交通流量需求。可解决相关行业对全时全范围交通流量数据资料的现实应用需求。时全范围交通流量数据资料的现实应用需求。时全范围交通流量数据资料的现实应用需求。

【技术实现步骤摘要】
一种全天时全路网的交通流量估计方法


[0001]本专利技术涉及地理信息系统和交通
,特别涉及一种近实时生产全天时城市全路网的交通流量估计方法。

技术介绍

[0002]机动车作为城市最主要的本地排放源之一,其排放污染物的调控是解决城市空气污染问题的关键。机动车排放清单是帮助了解机动车排放对于城市空气质量的关键技术其通过耦合城市机动车交通信息与机动车排放数据,建立计算模型。建立机动车排放清单的前提之一,就是获得实时全范围的机动车流量。常见的机动车流量监测数据包括道路卡口监测设备数据和浮动车GPS定位数据。前者由交通部门管理,主要在城市建成区范围和终点路段布设,存在数量有限,覆盖范围较少的局限;后者主要由具有导航业务的商业公司掌握,要获取全时全空间的数据成本非常高昂,面向环境领域的研究和业务应用和长期运行不具备可行性。
[0003]针对环境领域中的机动车排放清单计算问题,在实际上,对机动车流量的精度没有特别高的要求,更加关注机动车流量数据的及时性和覆盖范围。因此可以通过结合实测数据建立模拟模型的方法得到覆盖研究区域全范围的实时机动车流量数据。

技术实现思路

[0004]本专利技术针对现有技术的缺陷,提供了一种全天时全路网的交通流量估计方法。解决了机动车排放清单建立过程中的实时大范围路网交通流量数据的短缺问题。
[0005]为了实现以上专利技术目的,本专利技术采取的技术方案如下:
[0006]一种全天时全路网的交通流量估计方法,包括以下步骤:
[0007]步骤1:利用路网卡口监测交通流量数据和路网特征,基于梯度提升决策树的集成学习方法,建立和训练城市全路网基础交通流量模拟模型;
[0008]步骤2:对步骤1得到的交通流量模拟进行基于统计分析的异常处理;
[0009]步骤3:从互联网相关位置采集实时交通态势,并结合城市路网,建立交通态势路网匹配模型,提取路网的实时交通态势信息;
[0010]步骤4:结合路网交通态势数据和对应监测卡口数据,分析发现交通态势和交通流量之间的对应关系,并建立应用该对应关系的基础流量修正模型,得到基于实时交通态势的修正流量;
[0011]步骤5:引入POI数据、天气事件信息、交通突发事件信息的相关辅助信息,与监测卡口数据作对比分析,建立交通流量的辅助信息影响模型,并应用该辅助信息影响模型对步骤4得到的交通流量进行修正。
[0012]进一步地,步骤1中的建模表达为:
[0013]路段机动车流量~f(路网特征,日期特征,时刻特征)
[0014]其中,路段机动车流量指某小时内,某特定路段经过的机动车数量,且可按种类分
为大型汽车和小型汽车;
[0015]路网特征指路段的车道数、宽度的几何特征;日期特征指当日是否为节假日,是否为周末的特性;
[0016]时刻特征指当小时属于一日中的某个特定分段包括:早晚高峰。
[0017]进一步地,步骤1的具体子步骤如下:
[0018]a)获取目标城市的路网地理数据,并对路网数据进行特征提取,路网特征包括:路段宽度、路段车道数、路段到城市中心的距离、路段等级编码和路段的起止经纬度;
[0019]b)处理卡口监测交通流量数据;
[0020]卡口数据包括:车牌号、车速、车辆类型,在后续使用时,首先按照每个小时统计大小型车辆分组的经过总数和分别的平均速率。
[0021]c)建立机器学习模型所需的数据集;
[0022]以路段小时车辆数NUM和路段小时车辆平均速度SPEED_MEAN为目标,使用同一套数据集拟合。将路网特征和卡口数据按照路网唯一识别标识关联起来。在一小时内,建立特征与NUM和SPEED_MEAN的一一对应关系。模型表达为:
[0023]NUM=MODEL(FEATURES)(1)
[0024]SPEED_MEAN=MODEL(FEATURES)(2)
[0025]依据实际需要,还要对基本特征进行一定的运算和扩展,得到一些组合特征,即特征工程。完成上述操作后,数据集的字段数被扩展到数十个。
[0026]d)训练和测试机器学习模型;
[0027]采用梯度提升决策树的实现框架,即CatBoost,取历史卡口监测数据,按照随机原则划分训练集和测试集,并将训练集输入到框架中,以AUC和RMSE为评价指标,迭代优化模型,直到评价指标达到实用需求的标准。
[0028]进一步地,步骤2具体为:根据卡口数据统计得到城市车流量,并制定合适的规则处理模型输出。在监测卡口数据中统计路段历史上每个路段的历史车流量趋势,当路段模型模拟车流量极大偏离历史趋势时,对模拟值施加特定的值以减少其对历史车流量趋势的偏移。
[0029]进一步地,步骤3中具体子步骤如下:
[0030]a)下载互联网交通态势地图;
[0031]对指定城市范围内实时交通态势地图进行下载,并存储;
[0032]b)提取交通态势;
[0033]对交通态势地图自动识别,得到与图片相同大小的交通态势等级矩阵。并根据图像下载时的关于位置的请求参数,得到矩阵所有元素的位置信息。
[0034]c)匹配路网数据,得到路网交通态势数据;
[0035]交通态势等级矩阵元素的位置,与路网中路段进行空间匹配,将每个矩阵元素按照空间临近性,合并到其最近的路段上,每小时得到路网交通态势数据。
[0036]进一步地,步骤4的具体子步骤如下:
[0037]a)积累一定时间的路网交通态势数据,并且能够有相应时间的卡口监测数据,建立交通态势和卡口数据监测车流量的对应关系;
[0038]b)分析不同时间拥堵状态等级与车流量变化的关系。
[0039]c)依据拥堵状态等级与车流量变化的关系,建立一个半定量的车流调整模型。在步骤2产出的车流量处在历史认为的异常情况时,根据实时的路段拥堵状态等级,对产出的模拟车流量进行加权调整。
[0040]进一步地,步骤5中辅助信息影响模型的建立步骤如下:
[0041]a)POI数据表示了空间上各种人造设施的分布。应用空间临近分析方法,设定一个临近影响距离μ,按照路段ID计算每条路段附近μ内学校、医院、商业中心的数量,并以此为基础为每个路段赋予一个在0.8

1.2之间的POI调整系数,此外,针对一些普遍可知的热点地点,适当赋予特定的调整系数α;
[0042]b)对天气事件,自公开渠道抓取城市天气报告,经人工解译后,输入到数据库中,并将天气事件的位置与路段ID建立映射,按照天气事件的严重程度,为路段当时刻赋予值域处于0.6

1.0之间的天气事件调整系数β;
[0043]c)对突发交通事故,自交通管理部门获取道路安全事件简报,得到交通事故事发的位置和严重程度,以及可能引起的交通拥堵范围,将交通事故位置与路段ID建立映射,按照交通事故发生的情况,为路段当时刻赋予0.6

1.0之间的交通事故调本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种全天时全路网的交通流量估计方法,其特征在于,包括以下步骤:步骤1:利用路网卡口监测交通流量数据和路网特征,基于梯度提升决策树的集成学习方法,建立和训练城市全路网基础交通流量模拟模型;步骤2:对步骤1得到的交通流量模拟进行基于统计分析的异常处理;步骤3:从互联网相关位置采集实时交通态势,并结合城市路网,建立交通态势路网匹配模型,提取路网的实时交通态势信息;步骤4:结合路网交通态势数据和对应监测卡口数据,分析发现交通态势和交通流量之间的对应关系,并建立应用该对应关系的基础流量修正模型,得到基于实时交通态势的修正流量;步骤5:引入POI数据、天气事件信息、交通突发事件信息的相关辅助信息,与监测卡口数据作对比分析,建立交通流量的辅助信息影响模型,并应用该辅助信息影响模型对步骤4得到的交通流量进行修正。2.根据权利要求1所述的一种全天时全路网的交通流量估计方法,其特征在于:步骤1中的建模表达为:路段机动车流量~f(路网特征,日期特征,时刻特征)其中,路段机动车流量指某小时内,某特定路段经过的机动车数量,且按种类分为大型汽车和小型汽车;路网特征指路段的车道数、宽度的几何特征;日期特征指当日是否为节假日,是否为周末的特性;时刻特征指当小时属于一日中的某个特定分段包括:早晚高峰。3.根据权利要求2所述的一种全天时全路网的交通流量估计方法,其特征在于:步骤1的具体子步骤如下:a)获取目标城市的路网地理数据,并对路网数据进行特征提取,路网特征包括:路段宽度、路段车道数、路段到城市中心的距离、路段等级编码和路段的起止经纬度;b)处理卡口监测交通流量数据;卡口数据包括:车牌号、车速、车辆类型,在后续使用时,首先按照每个小时统计大小型车辆分组的经过总数和分别的平均速率;c)建立机器学习模型所需的数据集;以路段小时车辆数NUM和路段小时车辆平均速度SPEED_MEAN为目标,使用同一套数据集拟合;将路网特征和卡口数据按照路网唯一识别标识关联起来;在一小时内,建立特征与NUM和SPEED_MEAN的一一对应关系;模型表达为:NUM=MODEL(FEATURES)(1)SPEED_MEAN=MODEL(FEATURES)(2)依据实际需要,还要对基本特征进行一定的运算和扩展,得到一些组合特征,即特征工程;完成上述操作后,数据集的字段数被扩展到数十个;d)训练和测试机器学习模型;采用梯度提升决策树的实现框架,即CatBoost,取历史卡口监测数据,按照随机原则划分训练集和测试集,并将训练集输入到框架中,以AUC和RMSE为评价指标,迭代优化模型,直到评价指标达到实用需求的标准。
4.根据权利要求1所述的一种全天时全路网的交通流量估计方法,其特征在于:步骤2具体为:根据卡口数据统计得到城市车流量,并制定合适...

【专利技术属性】
技术研发人员:陈军辉伍强李媛邓顺强李俊洁周虹辉
申请(专利权)人:上海地听信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1