【技术实现步骤摘要】
基于机器学习算法的GPS终端与IC卡终端匹配方法和装置
本专利技术涉及GPS终端与IC卡终端匹配
,尤其涉及一种基于机器学习算法的GPS终端与IC卡终端匹配方法。
技术介绍
近年来,IC卡刷卡设备在城市公交上得到了广泛的应用。IC卡刷卡设备的广泛使用,使得IC卡刷卡数据成为低成本获取客流数据的新途径。然而,公交车的IC卡设备由第三方公司安装,没有与公交车的对应关系表,这给站点客流的获取造成了很大的困难。鉴于GPS设备和IC卡设备上各有一个时钟,理论上来讲,只要得到这两个时钟的对应关系,就能够推导出IC卡设备与公交车的对应关系。但由于时钟运行过程中,不可避免的会与真实时间产生偏差。并且IC卡设备的时点记录是由乘客刷卡产生,GPS设备的时点记录是公交车进站产生,有些站点没有乘客上下车,那就会出现某个站点就只有GPS设备的时点记录,没有IC卡设备的时点记录的情况;大部分站点上车乘客数量不止一个,IC卡设备在这个站点会有多条时点记录,而GPS设备仅有一条时点记录。此外,同一条线路的多辆公交进入同一站点的时间间隔有时会很 ...
【技术保护点】
1.一种基于机器学习算法的GPS终端与IC卡终端匹配方法,其特征在于,包括:/n读取GPS设备到站时间戳数据表、IC卡刷卡数据表、公交线路与GPS设备对应关系表的数据;/n对IC卡刷卡数据表进行预处理;/n对IC卡刷卡数据表的数据进行清洗;/n对IC卡刷卡设备时间序列与GPS时间序列的相似度进行评估;/n根据序列相似度的计算结果,对GPS设备和IC卡设备进行匹配。/n
【技术特征摘要】
1.一种基于机器学习算法的GPS终端与IC卡终端匹配方法,其特征在于,包括:
读取GPS设备到站时间戳数据表、IC卡刷卡数据表、公交线路与GPS设备对应关系表的数据;
对IC卡刷卡数据表进行预处理;
对IC卡刷卡数据表的数据进行清洗;
对IC卡刷卡设备时间序列与GPS时间序列的相似度进行评估;
根据序列相似度的计算结果,对GPS设备和IC卡设备进行匹配。
2.根据权利要求1所述的基于机器学习算法的GPS终端与IC卡终端匹配方法,其特征在于,所述IC卡刷卡数据表包括TIMESTAMP字段,所述对IC卡刷卡数据表进行预处理包括:根据所述TIMESTAMP字段增加SECONDS字段。
3.根据权利要求2所述的基于机器学习算法的GPS终端与IC卡终端匹配方法,其特征在于,所述对IC卡刷卡数据表的数据进行清洗,包括:
输入一条线路的刷卡数据,根据IC卡设备号进行分箱;
对同一个IC卡设备的刷卡数据,使用DBSCAN算法进行聚类,以获得不同站点的刷卡数据;
将同一站点的刷卡数据按时间点先后排序,取第一条记录做为该站点的进站时间戳;
将该设备经过的所有站点的进站时间戳按照时间升序排序,得到该IC卡设备的进站时间序列。
4.根据权利要求3所述的基于机器学习算法的GPS终端与IC卡终端匹配方法,其特征在于,所述DBSCAN算法的伪码包括:
5.根据权利要求1所述的基于机器学习算法的GPS终端与IC卡终端匹配方法,其特征在于,所述对IC卡刷卡设备时间...
【专利技术属性】
技术研发人员:蔡明,王波,林翰,冉雪峰,张慧怡,李宛瞳,
申请(专利权)人:深圳市市政设计研究院有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。