一种基于高速ETC收费数据的用户细分方法技术

技术编号:33542165 阅读:24 留言:0更新日期:2022-05-21 09:52
一种基于高速ETC收费数据的用户细分方法,对高速公路收费数据进行预处理,提取高速公路用户分类所需的字段信息,并以高速公路用户车牌号为关键字段存储基础信息,形成高速公路用户的出行基础数据;对每一高速公路用户的高速收费记录按照时间排序,依据时间和空间的异常状态进行数据清洗,得到数据清洗之后的高速收费数据;依据清洗后的数据,分别提取高速公路用户时间指标、空间指标和个人属性指标三个维度的信息,形成用户分类评价指标体系,并完成高速公路用户的分类;以月为周期依据高速公路用户出行的时间指标和空间指标进行分类,识别通勤出行、营运出行、零星出行、商务出行各类出行。本发明专利技术信息全、精度高,为高速公路规划和建设提供依据。和建设提供依据。和建设提供依据。

【技术实现步骤摘要】
一种基于高速ETC收费数据的用户细分方法


[0001]本专利技术涉及一种对高速公路用户识别和分类的方法。特别是涉及一种基于高速ETC收费数据的用户细分方法。

技术介绍

[0002]高速公路是城市交通的组成部分,掌握高速公路用户的出行需求对于高速公路规划和管理具有重要意义。《交通强国建设纲要》对高速公路运营管理和出行服务提出更高的要求,而传统的MTC(Manual Toll Collection system)人工收费系统对于用户的数据字段涉及较少,无法对高速公路用户进行持续分析。此外,如果利用交通调查、问卷等人工调查方式,有周期长、采样率低、成本高等劣势,并且由于数据质量较低,难以达到预期效果。
[0003]随着信息技术和基础设施的发展,ETC系统得到广泛应用,并且随着高速公路的运营产生了海量的ETC收费数据。ETC收费数据具有唯一标识用户的特征,实现了一人一车一签,为识别高速公路用户的通勤、营运、商务和零星等出行提供了可能。在2020年10月,ETC不停车收费系统的使用率接近70%,覆盖了大部分的高速公路用户,通过挖掘用户的出行特征,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于高速ETC收费数据的用户细分方法,其特征在于,是针对高速公路用户的通勤出行、营运出行、商务出行、零星出行的出行目的进行识别,包括以下步骤:1)对设定周期内高速公路收费数据进行预处理,提取高速公路用户分类所需的字段信息,并以高速公路用户车牌号为关键字段存储基础信息,形成高速公路用户的出行基础数据;2)对设定周期内每一高速公路用户的高速收费记录按照时间排序,依据时间和空间的异常状态进行数据清洗,得到数据清洗之后的高速收费数据;3)依据步骤2)清洗后的数据,分别提取设定周期内高速公路用户时间指标、空间指标和个人属性指标三个维度的信息,形成用户分类评价指标体系,并利用SOM聚类算法完成高速公路用户的分类;4)以月为周期依据高速公路用户出行的时间指标和空间指标进行分类,识别通勤出行、营运出行、零星出行、商务出行各类出行。2.根据权利要求1所述的一种基于高速ETC收费数据的用户细分方法,其特征在于,步骤1)包括:按照用户的车牌号,对设定周期内高速收费记录进行排序,剔除字段缺失,车牌号错误的异常数据记录,形成以下出行基础数据存储格式,[车牌号,进站时间,进站地点,出站时间,出站地点,计费距离,最终收费]。3.根据权利要求1所述的一种基于高速ETC收费数据的用户细分方法,其特征在于,步骤2)所述的依据时间的异常状态进行数据清洗是:读取设定周期内高速公路用户一次出行记录的出站时间和进站时间,并计算该记录下的行驶时间,如果行驶时间为负,即出站时间小于进站时间,或者行驶时间超过24小时,则判定本次消费记录为高速公路用户的时间异常数据,并剔除。4.根据权利要求1所述的一种基于高速ETC收费数据的用户细分方法,其特征在于,步骤2)所述的依据和空间的异常状态进行数据清洗是:读取设定周期内高速公路用户一次出行记录的出站时间、进站时间和计费距离,计算本次出行的行驶速度,若速度大于120km/h,或者计费距离大于1000km,则判定本次消费记录为高速公路用户的空间异常数据,并剔除。5.根据权利要求1所述的一种基于高速ETC收费数据的用户细分方法,其特征在于,步骤3)所述提取高速公路用户时间指标的方法为:统计设定周期内每个高速公路用户在设定周期内工作日出行和非工作日出行的天数,统计高峰时期和非高峰时期出行天数,其中所述的高峰时期为一天中的7:00

9:00的早高峰和17:00

19:00的晚高峰,其余时间为非高峰时期。6.根据权利要求1所述的一种基于高速ETC收费数据的用户细分方法,其特征在于,步骤3)所述的提取高速公路用户空间指标的方法为:提取高速公路每个用户在设定周期内出行中的所有收费站起终点并赋予编号a,然后依据编号统计设定周期内每个用户在每个起终点的出行频率,最后计算每个用户设定周期内在每个起终点的出行占比,计算公式如下:终点的出行频率,最后计算每个用户设定周期内在每个起终点的出行占比,计算公式如下:
其中,a为收费站设定周期内起终点编号...

【专利技术属性】
技术研发人员:常志宏陈雪珲贾健民曹蓉康传刚马小刚陈宏郭春晖
申请(专利权)人:山东建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1