The invention provides a large data environment to travel OD nodes identification and inter node path extraction method, the use of mobile data terminal of individual space activities within the specified time range set, mining a large number of individual travel trajectory data fitting, interpolation of the individual travel time series with equal time intervals; the spatial clustering method the search area may be in the clustering of individual travel time series, and through the comparison of angle clustering region center and clustering region external node clustering to determine whether the difference is extracted from the OD, and the user for time series segmentation. The invention can low cost, automation, convenient access to the specified travel time series is a large population within a time range, by using spatial clustering algorithm and weighted average method, quickly find out the node area with OD features, according to the rules of OD discrimination, thus convenient and efficient for users travel time series segmentation OD node based on the road.
【技术实现步骤摘要】
大数据环境下出行OD节点识别和节点间路径提取方法
本专利技术涉及一种大数据环境下、基于海量匿名加密时间序列定位数据的出行OD节点识别和OD节点间路径提取方法,属于大数据分析
技术介绍
近年来,随着信息技术的发展,数据信息量呈现爆炸式增长,数据来源越来越多,数据量也越来越庞大。其中,由手机、WIFI、物联网等信息传感器记录的数据已经成为大数据分析中最重要的数据来源,其较为完备的个体出行记录为大数据、尤其是交通大数据分析提供了很好的数据支持。以手机为例,至2015年,手机用户达到13.06亿,占到总人口的96%以上,手机终端设备持续产生的信号信息,形成了记录用户出行的一系列数据集,为分析城市人群出行、滞留等行为提供了重要的数据来源。然而,目前可供获得的手机信令大数据只包含了匿名加密用户与基站的通信记录,其中与用户出行行为相关的只有通信时间和基站编号等,用户的出行行为(包括出行的起止点、中间停留地、出行路径、出行方式等)只是蕴含在手机信令中,并没有直接表现出来,这就需要一种高效、简洁的算法对以手机信令数据构成的用户出行轨迹数据进行处理,识别出用户出行的O-D点,分割用户出行的O-D路径,提取用户的出行行为特征。现有技术中,并没有这样的算法。
技术实现思路
本专利技术要解决的技术问题是提供一种用于对以手机信令数据构成的用户出行轨迹数据进行处理,识别出用户出行的O-D点,分割用户出行的O-D路径的方法。为了解决上述技术问题,本专利技术的技术方案是提供一种大数据环境下出行OD节点识别和节点间路径提取方法,其特征在于,该方法由以下5个步骤组成:步骤1、读取从传感器 ...
【技术保护点】
一种大数据环境下出行OD节点识别和节点间路径提取方法,其特征在于,该方法由以下5个步骤组成:步骤1、读取从传感器运营商获取的匿名加密移动终端传感器数据,匿名加密移动终端传感器数据理论上在时间与空间上连续,不同移动终端对应不同的用户唯一编号EPID,提取每个EPID在指定时间段内所触发的通信信令记录,构成该EPID的出行数据集;步骤2、依次提取每个EPID在指定时间段内与传感器的通信记录,按时间顺序排序,建立用户出行轨迹数据集;从时间起点t0出发,以T时间为间隔对出行数据的空间位置进行插值,构建由真实点和插值点构成的用户出行时空序列;步骤3、对用户出行时空序列中O‑D点的节点聚类密度ρ和O‑D点半径内的最小节点数量ε,以及O‑D点前后出行时空序列的交角进行分析,设置参数的初始化,同时制定O‑D点的判别规则;步骤4、基于DBSCAN算法,设计一种基于距离的空间聚类算法;即在步骤2得到的聚类参数的基础上,对用户出行时空序列数据上的插值点进行空间聚类,提取出节点的聚类簇,从中提取出聚类簇中的最核心点;计算从最核心点出发,到节点聚类簇前后的第一个节点的方向角,计算用户在节点簇前后的出行时空序列的 ...
【技术特征摘要】
1.一种大数据环境下出行OD节点识别和节点间路径提取方法,其特征在于,该方法由以下5个步骤组成:步骤1、读取从传感器运营商获取的匿名加密移动终端传感器数据,匿名加密移动终端传感器数据理论上在时间与空间上连续,不同移动终端对应不同的用户唯一编号EPID,提取每个EPID在指定时间段内所触发的通信信令记录,构成该EPID的出行数据集;步骤2、依次提取每个EPID在指定时间段内与传感器的通信记录,按时间顺序排序,建立用户出行轨迹数据集;从时间起点t0出发,以T时间为间隔对出行数据的空间位置进行插值,构建由真实点和插值点构成的用户出行时空序列;步骤3、对用户出行时空序列中O-D点的节点聚类密度ρ和O-D点半径内的最小节点数量ε,以及O-D点前后出行时空序列的交角进行分析,设置参数的初始化,同时制定O-D点的判别规则;步骤4、基于DBSCAN算法,设计一种基于距离的空间聚类算法;即在步骤2得到的聚类参数的基础上,对用户出行时空序列数据上的插值点进行空间聚类,提取出节点的聚类簇,从中提取出聚类簇中的最核心点;计算从最核心点出发,到节点聚类簇前后的第一个节点的方向角,计算用户在节点簇前后的出行时空序列的交角;步骤5、根据步骤2得到的判别规则,判别步骤4得到的聚类簇是否是用户出行时空序列上的O-D点,对判别得到的O-D聚类簇进行整理,将其最核心节点作为O-D点,查找其原始的相近位置的记录点,将其位置投影到地图上,记录其实际的所在位置;根据提取得到的O-D点分割用户的出行数据,得到分段的、已表明起始点的用户出行轨迹。2.如权利要求1所述的一种大数据环境下出行OD节点识别和节点间路径提取方法,其特征在于,所述步骤1包括:步骤1.1、读取从传感器运营商获取匿名加密移动终端传感器数据,理论上匿名加密移动终端传感器数据在时间与空间上都应该是连续的,包括:用户唯一编号EPID、通信动作类型TYPE、通信动作发生时刻TIME、传感器所处大区REGIONCODE、传感器具体编号SENSORID;其中,传感器所处大区REGIONCODE及传感器具体编号SENSORID构成了传感器编号;步骤1.2、一条匿名加密移动终端传感器数据为一个信令记录,对每条信令记录进行解密;步骤1.3、根据用户唯一编号EPID,查询其在指定时间段内所有的通讯记录,构建用户出行轨迹数据。3.如权利要求2所述的一种大数据环境下出行OD节点识别和节点间路径提取方法,其特征在于,所述步骤2包括:步骤2.1、提取步骤1.3得到的用户出行轨迹数据中的所有的固定传感器编号REGIONCODE-SENSORID及其对应的经纬度坐标LON-LAT,将经纬度坐标转换为地理坐标X-Y;步骤2.2、遍历用户出行轨迹数据,将其按触发通信时间TIMESTAMP顺序排列;步骤2.3、从时间起点开始遍历出行数据,相邻的每3个通信记录点拟合一条二次曲线,二次曲线的x轴为用户出行轨迹的时间,y轴为通信记录点的X-Y坐标;设用户的出行轨迹包含n个通信记录点,n为正整数,则总共需要拟合出2n-4条二次曲线;步骤2.4、从整数时间起点t0出发,按时间间隔T计算用户在每个时间点的X-Y坐标,相同时间X(t0+nT)和Y((t0+nT)构成一个插值点,除首尾两段外,其余通信点之间都存在2条拟合曲线,在此之间的插值点的X-Y坐标由两条曲线的计算结果求平均得到;步骤2.5、所有插值点按时间顺序排序,所有插值点构成用户出行时空序列。4.如权利要求1所述的一种大数据环境下出行OD节点识别和节点间路径提取方法,其特征在于,所述步骤3包括:步骤3.1、选取若干已明确行迹中O-D点的用户出行时空序列作为样本,形成样本时空序列,分析并标出其O-D区域,O-D区域即O-D节点集合;步骤3.2、遍历样本时空序列,查找出每个O-D区域的第一个节点和最后一个节点,假设有n1个节点,n1为正整数,从第一个节点开始,分段计算O-D区域节点之间的空间距离,总共有n1-1段,对这些距离进行加和,计算O...
【专利技术属性】
技术研发人员:张颖,顾高翔,刘杰,吴佳玲,王伟娟,常华威,
申请(专利权)人:上海世脉信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。