当前位置: 首页 > 专利查询>武汉大学专利>正文

车载GPS时空轨迹大数据优选方法及系统技术方案

技术编号:12470241 阅读:104 留言:0更新日期:2015-12-09 19:25
一种车载GPS时空轨迹大数据优选方法及系统,包括根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每一个轨迹点所对应的路段;根据GPS轨迹误差分布规律,确定初始优选率;基于密度进行初步优选,包括按照密度评价模型和初始优选率进行初步优选,使得聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;基于角度相似性进行二次优选,包括利用角度相似性评价模型对初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最高的一类作为最终优选结果,得到被选优质数据。本发明专利技术提高了基于低精度车载GPS轨迹数据的整体定位精度,且优选方法简单、容易实现。

【技术实现步骤摘要】

本专利技术涉及一种车载GPS时空轨迹大数据优选技术方案,属于地理信息系统与智 能交通研究领域。
技术介绍
车载GPS时空轨迹大数据是目前城市计算、交通动态信息获取、人类行为模式探 测的重要数据源。通常大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、 管理和处理的数据集合,与计算机处理能力成正比,计算机处理能力越强,定义大数据边界 值也即数据量越大。目前车载GPS时空轨迹大数据主来来自安装有GPS定位装置和无线电 通信系统的城市出租车,其采集结果归属于单点定位技术(SPP/GPS)。同时因为其采集设 备、目的和复杂城市环境所影响,采集的GPS轨迹数据的定位精度一般为15m-20m左右并掺 杂有大量异常值,在城市遮挡严重的地方甚至会出现错误定位。相比于采用专业设备采集 的高精度GPS轨迹数据(搭载頂U/INS装备的采集车,采用松组合获取的差分GPS轨迹数 据,頂U/DGPS,定位精度通常在0. 5m左右),这种由出租车采集的GPS轨迹数据是一种低精 度的GPS轨迹数据。但是由于其采集成本低、采集周期短、覆盖面广,被广泛应用于城市相 关信息的提取。这些应用包括:1、城市计算,例如:城市热点分析、城市空间结构变化;2、交 通动态信息获取,例如:城市交通路网生成、交通流量监控、交叉口探测及交通规则;3、人 类行为模式探测,例如:城市人群移动模式分析、驾驶员驾驶行为探测等。同时为了克服其 数据质量问题,很多学者提出了相应的数据优化方法,包括:数据压缩(减少海量数据的存 储量,加快数据传输、处理、分析速度),地图匹配(弱化低质GPS轨迹数据定位精度低的劣 势,强化GPS轨迹数据在空间信息方面的优点),聚类方法去除原始GPS轨迹数据内的异常 值(去除外部漂移点)等。虽然,这些方法在一定程度上为不同研究目的的课题提供了满 足相应精度要求的数据源,但是仍然无法实现GPS轨迹数据质量的真正优化。另外,上述数 据优化的方法也无法为未来城市精细信息获取提供优质的数据源。
技术实现思路
本专利技术在以上研究的基础上,提出了顾忌GPS轨迹向量距离和角度的二次优选技 术方案,从海量低质车载GPS轨迹数据中优选出精度相对较高的优质GPS轨迹数据。 本专利技术提供一种车载GPS时空轨迹大数据优选方法,其特征在于:包括以下步骤, 步骤1,根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每 一个轨迹点所对应的路段,然后以每一条路段上所对应的轨迹点作为优化目标; 步骤2,根据GPS轨迹误差分布规律,确定初始优选率; 步骤3,基于密度进行初步优选,包括按照密度评价模型,对优选目标内的所有轨 迹点进行密度分布计算,并进行降序排列,按照步骤2所述初始优选率进行初步优选,使得 聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选; 所述对优选目标内的所有轨迹点进行密度分布计算,包括根据以下密度评价模型 对各个轨迹点的密度值进行计算, r = mL+vaL 其中,r为轨迹点的邻域半径,mL和VarL分别表示优化目标内所有GPS轨迹点构 成三角网的所有边长的均值和标准差,Density 1表示任意一个轨迹点p i的平面密度;m 1表 示以轨迹点P1S中心以r为半径的邻域内,包含其他轨迹点的个数;N表示优化目标内所有 轨迹点的个数; 步骤4,基于角度相似性进行二次优选,包括利用角度相似性评价模型,对步骤3 初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最 高的一类作为最终优选结果,得到被选优质数据。 而且,步骤1中,确定每一个轨迹点所对应的路段,包括确定轨迹点对应的路段 ID,所述路段ID为路段的编号。 而且,步骤2中,当定位精度为15m时,将68. 2%作为初步优选比例。 而且,步骤4中,进行聚类处理时,以角度差异Γ时所对应的相似度值作为聚类 阈值进行聚类。 而且,设步骤3基于密度进行初步优选后得到初步优选集T, 设初步优选集T内有s个轨迹点,构成s-1个轨迹向量,记为P1, 卜 A={(xk,yk),(n,yk+1)},其中,:?表示第 k 个轨迹向量,k = 1, 2,…,S-1,(xk, yk)表示 1?的 起点坐标,(xk+1,yk+1)表示%的终点坐标, 计算任意两个轨迹向量之间的相似度如下, 其中sim (?,苒)表示初步优选结果内,任意两个轨迹向量心,可间的相似度; cosi?:,可)则表示轨迹向量^与拓角度差异的余弦值,其中k = 1,2,…,S-1,t = 1,2,… ,s_l 〇 本专利技术提供一种车载GPS时空轨迹大数据优选系统,包括以下模块, 初始匹配模块,用于根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配 处理,确定每一个轨迹点所对应的路段,然后以每一条路段上所对应的轨迹点作为优化目 标; 初始优选率设定模块,用于根据GPS轨迹误差分布规律,确定初始优选率; 初选模块,用于基于密度进行初步优选,包括按照密度评价模型,对优选目标内的 所有轨迹点进行密度分布计算,并进行降序排列,按照初始优选率进行初步优选,使得聚集 在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选; 所述对优选目标内的所有轨迹点进行密度分布计算,包括根据以下密度评价模型 对各个轨迹点的密度值进行计算, r = mL+vaL 其中,r为轨迹点的邻域半径,mL和varL分别表示优化目标内所有GPS轨迹点构 成三角网的所有边长的均值和标准差,Density 1表示任意一个轨迹点p i的平面密度;m 1表 示以轨迹点P1S中心以r为半径的邻域内,包含其他轨迹点的个数;N表示优化目标内所有 轨迹点的个数; 终选模块,用于基于角度相似性进行二次优选,包括利用角度相似性评价模型,对 初选模块初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相 似度值最高的一类作为最终优选结果,得到被选优质数据。 而且,初始匹配模块中,确定每一个轨迹点所对应的路段,包括确定轨迹点对应的 路段ID,所述路段ID为路段的编号。 而且,初始优选率设定模块中,当定位精度为15m时,将68. 2%作为初步优选比 例。 而且,终选模块中,进行聚类处理时,以角度差异Γ时所对应的相似度值作为聚 类阈值进行聚类。 而且,设初选模炔基于密度进行初步优选后得到初步优选集T, 设初步优选集T内有s个轨迹点,构成S-I个轨迹向量,记为,匕,…^^}, i%=:Kxk,yk),(xk_4,yk-1)〖,其中,当前第1页1 2 3 4 本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN105138779.html" title="车载GPS时空轨迹大数据优选方法及系统原文来自X技术">车载GPS时空轨迹大数据优选方法及系统</a>

【技术保护点】
一种车载GPS时空轨迹大数据优选方法,其特征在于:包括以下步骤,步骤1,根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每一个轨迹点所对应的路段,然后以每一条路段上所对应的轨迹点作为优化目标;步骤2,根据GPS轨迹误差分布规律,确定初始优选率;步骤3,基于密度进行初步优选,包括按照密度评价模型,对优选目标内的所有轨迹点进行密度分布计算,并进行降序排列,按照步骤2所述初始优选率进行初步优选,使得聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;所述对优选目标内的所有轨迹点进行密度分布计算,包括根据以下密度评价模型对各个轨迹点的密度值进行计算,r=mL+vaLDensityi=miN]]>其中,r为轨迹点的邻域半径,mL和varL分别表示优化目标内所有GPS轨迹点构成三角网的所有边长的均值和标准差,Densityi表示任意一个轨迹点pi的平面密度;mi表示以轨迹点pi为中心以r为半径的邻域内,包含其他轨迹点的个数;N表示优化目标内所有轨迹点的个数;步骤4,基于角度相似性进行二次优选,包括利用角度相似性评价模型,对步骤3初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最高的一类作为最终优选结果,得到被选优质数据。...

【技术特征摘要】

【专利技术属性】
技术研发人员:唐炉亮杨雪李清泉
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1