伪码信令数据预处理与出行链识别方法技术

技术编号:19971005 阅读:41 留言:0更新日期:2019-01-03 16:36
本发明专利技术公开了一种伪码信令数据预处理及出行链识别方法,包括以下步骤:(1)冗余信令记录合并与异常记录剔除;(2)根据乒乓效应记录参数特征,识别乒乓记录并删除;(3)计算用户驻留质心,设定出行发生的时间、空间阈值,识别出行开始记录点;(4)设定用户驻留时间、空间阈值,识别出行结束记录点,完成出行链识别。本发明专利技术对数据进行有效清洗过滤,提高数据精准度,并将庞杂的数据提取为有价值的出行OD信息,提高数据在交通等各个领域的可用性。本发明专利技术方法适用范围广,简单易行。

Pseudo Code Signaling Data Preprocessing and Travel Chain Recognition

The invention discloses a pseudo-code signaling data pre-processing and trip chain identification method, which includes the following steps: (1) merging redundant signaling records and eliminating abnormal records; (2) identifying and deleting ping-pong records according to the characteristics of ping-pong effect recording parameters; (3) calculating the user's Residence Center of mass, setting the time and space threshold of trip occurrence, and identifying the start point of trip; (4) setting the user's residence. Time and space thresholds are used to identify end-of-trip record points and complete trip chain recognition. The invention effectively cleans and filters the data, improves the accuracy of the data, extracts the huge and complicated data into valuable travel OD information, and improves the usability of the data in various fields such as transportation. The method of the invention has wide application range and is simple and feasible.

【技术实现步骤摘要】
伪码信令数据预处理与出行链识别方法
本专利技术涉及交通行业大数据处理与分析
,具体的说是从交通行业对伪码信令数据应用的角度,对伪码信令数据进行预处理及出行链识别的方法。
技术介绍
随着大数据时代的到来,伪码信令数据等在交通、城市规划等诸多领域崭露头角。大数据技术的广泛研究与应用,为交通拥堵等“交通病”问题的解决带来了新的契机。但目前对大数据的应用刚刚起步,大数据处理与分析技术仍处于发展阶段,如何从粗糙的海量数据中提取有效数据,精确识别对交通行业有价值的出行链路信息,是研究与应用人员都需要面临的一大难题。数据清洗方面,现有技术主要沿用传统数据预处理算法对信令数据进行清洗,包括冗余数据删除、异常数据过滤等,并未考虑信令数据自身特征,如特有的乒乓效应等,进而不能够“对症下药”,达到较高的数据清洗水平,降低了数据的准确性与可信度,更大大降低了信令数据在交通领域的可用性。现有的考虑数据乒乓效应,进行乒乓记录剔除的技术中,均只针对单条记录进行过滤,对多条连续记录混杂的乒乓记录无法进行有效剔除。以上数据清洗技术的不完善,限制了大数据在交通行业应用的可信度。出行链识别方面,现有技术主要基于用户本文档来自技高网...

【技术保护点】
1.伪码信令数据预处理与出行链识别方法,其特征在于,包括如下步骤:计算记录间隔时间、距离等交通特征参数,进行冗余信令记录合并与异常记录剔除;根据乒乓效应记录时间、距离、方向等参数特征,设定阈值,有效识别乒乓记录并删除;计算用户驻留质心,设定出行发生的时间、空间阈值,识别出行开始记录点;设定用户驻留时间、空间阈值,识别出行结束记录点,完成一次完整出行的识别。

【技术特征摘要】
1.伪码信令数据预处理与出行链识别方法,其特征在于,包括如下步骤:计算记录间隔时间、距离等交通特征参数,进行冗余信令记录合并与异常记录剔除;根据乒乓效应记录时间、距离、方向等参数特征,设定阈值,有效识别乒乓记录并删除;计算用户驻留质心,设定出行发生的时间、空间阈值,识别出行开始记录点;设定用户驻留时间、空间阈值,识别出行结束记录点,完成一次完整出行的识别。2.根据权利要求1所述的伪码信令数据预处理与出行链识别方法,其特征在于:所述冗余记录与异常记录通过如下步骤识别:将各独立用户一天内的信令记录按照时间序列进行排序;依次计算同一用户相邻记录时间差与空间距离,进而计算用户移动速度=空间距离/时间差;将短时间间隔内空间位置不变的冗余记录进行合并;将用户移动速度超过城市限速的异常记录进行剔除。3.根据权利要求1所述的伪码信令数据预处理与出行链识别方法,其特征在于:所述乒乓效应记录通过如下步骤识别,提出通过信令记录分组与分析组间闭环进而识别乒乓效应记录的算法:a.将按时间排序后的时间序列数据中,相邻、相同经纬度的记录归为同组:原始记录位置:xya,xya,xyb,xyb,…xya,xya,xya…分组结果:其中,xyi为经纬度位置组合,为所分位置组;b.寻找经纬度位置组形成的位置闭环,所述闭环可为两个位置组闭环或多位置组闭环:xyA1=xyA2=xya空间位置相同,则形成位置闭环;c.计算形成一个完整闭环的时间间隔,闭环内各位置组最远空间距离,以及闭环内各位置点改变的方向角:△t=tA2-start-tA1-end其中△αi=αi-αi-1其中△t为形成闭环时间间隔,tA2-start为A2组开始时间,tA1-end为A1组结束时间;△dmax为闭环内各组最远空间距离,dxy为计算组间距离函数,△...

【专利技术属性】
技术研发人员:雷方舒赵祥孙建平温慧敏郭继孚张溪朱珊
申请(专利权)人:北京交通发展研究院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1