一种面向海量历史浮动车数据的分布式地图匹配方法组成比例

技术编号：10724918 阅读：169 留言：0更新日期：2014-12-04 01:51

一种面向海量历史浮动车数据的分布式地图匹配方法，包括以下步骤：步骤(1)将海量浮动车数据上传至Hadoop分布式文件系统；步骤(2)分布式数据清洗；步骤(3)将道路节点信息通过分布式缓存方法存储到各个Slave子节点上时，在任何Job在节点上执行之前，先对道路节点信息建立网格索引；步骤(4)通过Hadoop的Map-Reduce框架从分布式文件系统HDFS中读取清洗后的浮动车数据，同样对其进行切片处理，以128M为单元切片成多个数据块，然后将数据块分发到各个节点的Map-Reduce上，同时读取分布式缓存中的道路节点信息进行地图匹配运算，实现分布式运算；步骤(5)Reduce函数将匹配后的信息存储到Hadoop分布式文件系统中。本发明专利技术计算速度较快、时间耗费量较小。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】，包括以下步骤：步骤(1)将海量浮动车数据上传至Hadoop分布式文件系统；步骤(2)分布式数据清洗；步骤(3)将道路节点信息通过分布式缓存方法存储到各个Slave子节点上时，在任何Job在节点上执行之前，先对道路节点信息建立网格索引；步骤(4)通过Hadoop的Map-Reduce框架从分布式文件系统HDFS中读取清洗后的浮动车数据，同样对其进行切片处理，以128M为单元切片成多个数据块，然后将数据块分发到各个节点的Map-Reduce上，同时读取分布式缓存中的道路节点信息进行地图匹配运算，实现分布式运算；步骤(5)Reduce函数将匹配后的信息存储到Hadoop分布式文件系统中。本专利技术计算速度较快、时间耗费量较小。【专利说明】—种面向海量历史浮动车数据的分布式地图匹配方法
本专利技术属于海量数据处理计算领域和智能交通领域，具体涉及一种分布式地图匹配方法。
技术介绍
浮动车数据是最重要的交通数据之一，其输出结果不仅能为相关部门提供道路实时交通状况信息，而且可为道路建设规划、拥堵缓解等各项工作提供定量数据分析基础。地图匹配技术是浮动车数据处理中最关键的一项内容之一，只有判断出车辆在哪条道路上行驶，才能将GPS数据转化为有效的道路交通状态信息。浮动车数据库中往往存储着海量的历史数据。对这些海量历史浮动车数据的地图匹配是时空关联性挖掘、缺失值插补、浮动车轨迹研究、交通限制条件挖掘等各种数据处理与分析任务的先决条件。在传统的串行匹配技术下，普通计算海量浮动车数据进行地图匹配会耗费大量的计算时间。以10000辆出租车每2...

【技术保护点】
一种面向海量历史浮动车数据的分布式地图匹配方法，其特征在于：所述匹配方法包括以下步骤：步骤(1):将海量浮动车数据上传至Hadoop分布式文件系统HDFS；步骤(2):分布式数据清洗，首先对原始数据进行切片，以128M为单元切片成多个数据块，然后将数据块分发到各个节点的Map‑Reduce上进行数据预处理,依据各个数据项的判别规则，实现分布式运算，当且仅当满足所有数据项判别规则时该数据行才会被保留，否则删除存在数据缺失或数据明显偏离正常值的数据行,最后将清洗后的数据重新存回Hadoop分布式文件系统HDFS上；步骤(3):将道路节点信息通过分布式缓存方法存储到各个Slave子节点上时，在任何Job在节点上执行之前，先对道路节点信息建立网格索引；步骤(4):通过Hadoop的Map‑Reduce框架从分布式文件系统HDFS中读取清洗后的浮动车数据，同样对其进行切片处理，以128M为单元切片成多个数据块，然后将数据块分发到各个节点的Map‑Reduce上，同时读取分布式缓存中的道路节点信息进行地图匹配运算，实现分布式运算；将逐行读取文件块并将行号及该行内容映射为初始键值输入,采用...

【技术特征摘要】

【专利技术属性】
技术研发人员：薛益赵，李建元，钱涛，倪升华，李丹，陈涛，王浩，
申请(专利权)人：银江股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人