当前位置: 首页 > 专利查询>东南大学专利>正文

基于时空分析的交通流数据清洗方法技术

技术编号:8626192 阅读:202 留言:0更新日期:2013-04-25 23:21
本发明专利技术公开了一种基于时空分析的交通流数据清洗方法,包括脏数据存储模块、干净数据存储模块和运算模块,其中:所述脏数据存储模块,对实时接收到的交通流信息不加改变的按照固定格式进行存储;所述运算模块,按照固定时间间隔从脏数据存储模块中提取最新数据,同时从干净数据库中提取与之在时间和空间存在匹配关系的数据,进行运算;所述干净数据存储模块,对运算模块运算完毕后的数据按照固定格式进行存储。本发明专利技术通过简化交通流数据清洗过程,采用用时间与空间并行分析方法,从而方便、快捷、准确的进行交通流数据清洗工作。在简化交通流数据清洗过程,提供交通流数据清洗质量方面,具有实际工程运用价值。

【技术实现步骤摘要】

本专利技术属属于数据处理领域,尤其涉及一种基于时空分析的交通流数据清洗系统和方法。
技术介绍
随着城市交通压力的不断上升,智能交通系统在城市交通管理与控制体系中发挥着越来越重要的作用。而交通流基础数据库的正确性、完整性以及可靠性,则是整个智能交通系统高效运转的基础保障。然后现有的交通采集系统、信息传输系统在对数据的采集、传输及存储操作中存在着很多问题,容易产生脏数据,如检测装置失灵,数据发送失败等等。这些脏数据可能会导致智能交通系统决策失败甚至错误。因此必须在数据提取应用前对脏数据进行有效的处理,保障交通流基础数据库的数据质量。在这一领域内,国内外已经有了不少相关研究及工程应用产品。传统的交通流数据清洗过程通常包括数据属性分析、确定清洗方案、检验清洗结果、脏数据清洗以及数据更新5个阶段,且为了应付脏数据出行的不同情况,如数据错误、数据丢失、数据漂移等,需要进行相应的处理,处理过程繁琐。同时在进行脏数据清洗时,到目前为止也已出现了一系列相应的技术方法与手段,主要可分为两大类以统计学为基础的预测模型和以智能算法为主要研究手段形成的预测模型。但是前一类方法包括卡尔曼滤波模型、参数回归模型、时间序列模型等,仅考虑采用历史因素为数据进行处理,不适于时变的复杂系统,精度较低;后一类方法包括状态相空间重构模型、小波分解模型、神经网络、支持向量机等,方法过于复杂,不适于实际应用。
技术实现思路
专利技术目的针对上述现有存在的问题和不足,本专利技术的目的是提供一种,本专利技术改善传统的交通流数据清洗过程,使其简洁明了,同时改进脏数据清洗时的技术手段,使其监督方法的能够兼顾算法复杂性与结果精确性,是本专利技术主要解决的问题。技术方案为实现上述专利技术目的,本专利技术采用以下技术方案一种,包括脏数据存储模块、干净数据存储模块和运算模块,其中所述脏数据存储模块,对实时接收到的交通流信息不加改变的按照固定格式进行存储;所述运算模块,按照固定时间间隔从脏数据存储模块中提取最新数据,同时从干净数据库中提取与之在时间和空间存在匹配关系的数据,进行运算;所述干净数据存储模块,对运算模块运算完毕后的数据按照固定格式进行存储。所述脏数据存储模块中接收的交通流信息为包括13个字段的49位的十进制代码,其中各字段名称及其长度位数如下检测器序号,日期,时间,第一车道流量,第二车道流量,第三车道流量,第四车道流量,第五车道流量,第六车道流量,第七车道流量,第八车道流量,第九车道流量,第十车道流量;前述各字段的长度位数依次分别为5位、8位、6位、3位、3位、3位、3位、3位、3位、3位、3位、3位和3位。所述运算模块的运算方法如下首先,运算模块每隔TO时间从脏数据存储模块中遍历所有m个检测器序号ID,并分别提取相同ID的数据中时刻最新的数据,分别为{A” A2, A3,…,AJ,同时在干净数据存储模块中,遍历所有m个检测器序号ID,并分别提取相同ID的数据中时刻最新的4条数据,分别记为(B11, B12, B13, B14), (B21, B22, B23, B24), (B31, B32, B33, B34),…,(B;, Bffl2, Bffl3, Bffl4)};其中任意Ai或者均为长度49位的十进制代码,i和j为自然整数;Ai={ID, DATE, TIME, LANE[I], LANE[2], LANE[3], LANE[4], LANE[5], LANE[6],LANE [7],LANE [8],LANE [9],LANE [10]}根据空间位置关系,定义检测器周围Ikm范围内检测器为相关检测器,若第k个检测器的相关检测器分为为第K1, k2,…,kn,则在进行数据清洗时,对第k个检测器进行如下运算Ck · Id = Ak · IDCk · DATE=Bk1. DATECk · TIME=Bk1. TIME+TO本文档来自技高网...

【技术保护点】
一种基于时空分析的交通流数据清洗方法,其特征在于:包括脏数据存储模块、干净数据存储模块和运算模块,其中:所述脏数据存储模块,对实时接收到的交通流信息不加改变的按照固定格式进行存储;所述运算模块,按照固定时间间隔从脏数据存储模块中提取最新数据,同时从干净数据库中提取与之在时间和空间存在匹配关系的数据,进行运算;所述干净数据存储模块,对运算模块运算完毕后的数据按照固定格式进行存储。

【技术特征摘要】
1.一种基于时空分析的交通流数据清洗方法,其特征在于包括脏数据存储模块、干净数据存储模块和运算模块,其中 所述脏数据存储模块,对实时接收到的交通流信息不加改变的按照固定格式进行存储; 所述运算模块,按照固定时间间隔从脏数据存储模块中提取最新数据,同时从干净数据库中提取与之在时间和空间存在匹配关系的数据,进行运算; 所述干净数据存储模块,对运算模块运算完毕后的数据按照固定格式进行存储。2.根据权利要求1所述基于时空分析的交通流数据清洗方法,其特征在于所述脏数据存储模块中接收的交通流信息为包括13个字段的49位的十进制代码,其中各字段名称及其长度位数如下 检测器序号,日期,时间,第一车道流量,第二车道流量,第三车道流量,第四车道流量,第五车道流量,第六车道流量,第七车道流量,第八车道流量,第九车道流量,第十车道流量;前述各字段的长度位数依次分别为5位、8位、6位、3位、3位、3位、3位、3位、3位、3位、3位、3位和3位。3.根据权利要求1所述基于时空分析的交通流数据清洗方法,其特征在于所述运算模块的运算方法如下 首先,运算模块每隔TO时间从脏数据存储模块...

【专利技术属性】
技术研发人员:刘攀俞灏罗旭江樊蓉羊钊李志斌徐铖铖陈金林
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1