一种交通智能卡数据清洗方法及系统技术方案

技术编号:43916908 阅读:12 留言:0更新日期:2025-01-03 13:22
本申请涉及数据处理技术领域,具体涉及一种交通智能卡数据清洗方法及系统,该方法包括:采集所有交通智能卡数据,根据任意两条交通智能卡数据的线路之间的相似性特征、进出站点时间间隔以及途经站点数量的关系、进站时间的差异,得到交通智能卡数据的信息贡献度;对所述信息贡献度在聚类过程中的距离度量进行调整;基于聚类的异常检测算法,得到各条交通智能卡数据的异常值;结合阈值分割算法,对交通智能卡数据进行清洗。本申请旨在分析影响交通通行的因素,提高异常检测的准确性和数据清洗的有效性。

【技术实现步骤摘要】

本申请涉及数据处理,具体涉及一种交通智能卡数据清洗方法及系统


技术介绍

1、随着城市公共交通系统的日益完善和优化,以及绿色出行的观念越来越深入人心,使得公共交通的出行比例不断提高,客流量日益增大,从而也产生了大量的交通出行数据,这些数据可以通过交通智能卡的信息反映出来。通过对数据规模庞大的交通智能卡数据进行挖掘,可以得到许多有用的信息,通过这些信息可以指导交通规划和运营,提升公共交通的便利性和服务质量。

2、由于各种因素可能导致乘客的交通智能卡数据出现异常,在数据清洗过程中,通常会使用异常检测算法来识别这些异常数据。在基于聚类的异常检测算法中,异常检测过程首先依赖于聚类,然后基于聚类结果计算异常值。然而,该算法在聚类阶段没有考虑每条交通智能卡数据所携带的信息是否具备普遍性,最终的聚类结果仅依据数据间的差异产生,而忽视了交通通行条件的变化,从而使得异常检测结果不准确,影响数据清洗的有效性。


技术实现思路

1、鉴于以上内容,有必要提供一种交通智能卡数据清洗方法及系统,解决上述问题

2、本文档来自技高网...

【技术保护点】

1.一种交通智能卡数据清洗方法,其特征在于,该方法包括以下步骤:

2.如权利要求1所述的一种交通智能卡数据清洗方法,其特征在于,所述任意两条交通智能卡数据之间的第一贡献度的获取过程为:

3.如权利要求1所述的一种交通智能卡数据清洗方法,其特征在于,所述任意两条交通智能卡数据之间的第二贡献度的获取步骤为:

4.如权利要求2所述的一种交通智能卡数据清洗方法,其特征在于,所述得到各条交通智能卡数据的信息贡献度,具体为:

5.如权利要求4所述的一种交通智能卡数据清洗方法,其特征在于,所述任意两条交通智能卡数据之间的第三贡献度的获取过程包括:

...

【技术特征摘要】

1.一种交通智能卡数据清洗方法,其特征在于,该方法包括以下步骤:

2.如权利要求1所述的一种交通智能卡数据清洗方法,其特征在于,所述任意两条交通智能卡数据之间的第一贡献度的获取过程为:

3.如权利要求1所述的一种交通智能卡数据清洗方法,其特征在于,所述任意两条交通智能卡数据之间的第二贡献度的获取步骤为:

4.如权利要求2所述的一种交通智能卡数据清洗方法,其特征在于,所述得到各条交通智能卡数据的信息贡献度,具体为:

5.如权利要求4所述的一种交通智能卡数据清洗方法,其特征在于,所述任意两条交通智能卡数据之间的第三贡献度的获取过程包括:

6.如权利要求1所述的一种交通智能卡数据清洗方法,其特征在于,所述...

【专利技术属性】
技术研发人员:陈文革邢钊许占富王光欣刘世俊
申请(专利权)人:北京市政交通一卡通支付有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1