【技术实现步骤摘要】
一种车辆轨迹数据清洗与校准方法
[0001]本专利技术涉及车辆数据处理领域,尤其是涉及一种车辆轨迹数据清洗与校准方法。
技术介绍
[0002]在车辆行驶的过程中,车辆采集器需采集的数据量较大,这些数据能为车辆方面的应用提供有效价值,例如车辆行驶过程异常监控、车辆行驶效率评估、路线的调整与规划等等。但车辆采集器在采集数据的过程中,有时会因地形阻碍、信号不稳定、信道堵塞等诸多不可避免的因素影响到车辆行驶数据的质量,例如出现缺失点、重复点、离群点等异常数据。因此在对车辆行驶数据进行数据分析之前,数据的清洗是关键所在。
[0003]数据清洗的过程中,最为重要的环节是异常值检测和处理,针对轨迹类数据,常采用的方法是均值滤波、密度聚类等。不同的轨迹数据应选择合适的方法进行处理。如名称为“基于局部遍历密度聚类的ADS
‑
B航迹清洗与校准方法”(公开号为CN110362559A)的专利技术专利,是将航行轨迹数据通过局部遍历密度聚类算法对速度、经度、纬度、压力高度等字段进行清洗与校准,使航行轨迹数据内的航迹点满足质点运动学规律,但车辆行驶数据不同于航迹数据,大部分不会受到压力、气流等影响。如名称为“一种基于路网数据的GPS轨迹清洗方法”(公开号为CN112748452A)的专利技术专利,利用城市路网空间数据,优化GPS清洗数据,使得对异常值的剔除和跳跃点之间的补植更符合真实情况,该方法虽然能将速度与经度和纬度的结合进行清洗,但直接剔除异常值会对车辆安全的性能检测有较大的影响,不能为后续对车辆行驶异常进行检测提 ...
【技术保护点】
【技术特征摘要】
1.一种车辆轨迹数据清洗与校准方法,其特征在于:具体步骤如下:(1)建立包含特征字段的车辆轨迹数据样本,其中特征字段由初始字段和扩展字段组成,所述初始字段由车辆行程采集器获取,所述扩展字段由所述初始字段计算得出;(2)对车辆轨迹数据样本进行去重;(3)选取所需检测的特征字段;(4)对所需检测的特征字段进行缺失点排查;(5)对车辆轨迹缺失点的特征字段进行数据填补;(6)依据真实距离检测法对车辆轨迹数据样本进行车辆轨迹离群点标识;(7)根据车辆轨迹数据样本中的初始数据对车辆轨迹离群点进行修正。2.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(1)中建立包含特征字段的车辆轨迹数据样本,具体操作过程如下:第一步,建立包含特征字段的车辆轨迹数据样本,车辆轨迹数据样本由N个车辆轨迹点组成,将该车辆轨迹数据样本表示为Loc={P1,P2,...,P
N
},i=1,2,...,N,其中P
i
表示第i个车辆轨迹点,N为车辆轨迹数据中车辆轨迹点的个数;车辆轨迹点P
i
具体包括的初始字段有:车牌号ID
i
、时间戳T
i
、速度V
i
、方向θ
i
、经度Lon
i
、纬度Lat
i
以及所属单位Cor
i
,车辆轨迹点P
i
具体包括的扩展字段有:当前车辆加速度a
i
;第二步,扩展字段内的当前车辆加速度a
i
由所述初始字段计算得出。具体计算当前车辆加速度a
i
公式如下所示:3.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(2)中对车辆轨迹数据样本进行去重,具体操作过程如下:第一步,根据时间戳T
i
的顺序,对车辆轨迹数据样本内的车辆轨迹点P
i
进行排序;第二步,以时间戳T
i
为基准,找到与时间戳T
i
相等的所有车辆轨迹点,将这些车辆轨迹点从Loc内除去并加入至车辆轨迹时间重复数据集Loc'中;若Loc'内的车辆轨迹点P
i
为时间戳的起始点,则计算出该车辆轨迹点到后一个时间戳下的车辆轨迹点P
x
的欧氏距离;若Loc'内的车辆轨迹点P
i
为时间戳的结束点,则计算出该车辆轨迹点到前一个时间戳内的车辆轨迹点P
y
的欧氏距离;具体的欧氏距离公式如下所示:其中,m,n为需要计算欧氏距离的两个车辆轨迹点的下标;同理,计算出Loc'内所有车辆轨迹点的欧氏距离,将Loc'内欧氏距离最小的车辆轨迹点作为该时间戳下的车辆轨迹点;第三步,将Loc'内的车辆轨迹点与被提取后的Loc进行合并,根据时间戳的顺序重新编号,得到去重后的车辆轨迹数据样本Loc
d
={P1,P2,...,P
M
},其中M为去重后的车辆轨迹数据中车辆轨迹点个数。4.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(3)中选取所需检测的特征字段,具体操作过程如下:第一步,根据采集的数据样本为一辆车的某一时间段的车辆轨迹数据,选取所需检测
的特征字段包括:时间戳T、速度V、方向θ、经度Lon、纬度Lat以及当前车辆加速度a。5.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(4)中对于所需检测的特征字段进行缺失点排查,具体操作过程如下:第一步,依据采集器设定的采集时间间隔t=15(单位:秒),对车辆轨迹数据样本Loc
d
={P1,P2,...,P
M
}中的任意车辆轨迹点P
i
进行检测,若P
i
中存在缺失的特征字段,则将P
i
标记为车辆轨迹缺失点,并将该车辆轨迹缺失点P
i
加入缺失车辆轨迹域S中;若P
i
中不存在缺失的特征字段,则将P
i
加入无缺失车辆轨迹域A中;第二步,对下一个车辆轨迹点P
i+1
重复第一步,直至最后一个车辆轨迹点P
N
检测结束;第三步,将缺失车辆轨迹域S内的所有车辆轨迹缺失点进行合并得到缺失点集合其中a≠b;将无缺失车辆轨迹域A内的所有车辆轨迹点进行合并得到无缺失点集合6.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(5)中对车辆轨迹缺失点的特征字段进行数据填补,具体操作过程如下:第一步,以缺失点集合Loc
s
内的车辆轨迹缺失点P
i
为填补对象,在无缺失点集合Loc
A
内以i为中心点下标,前后各获取m个车辆轨迹点,将该组数据记为第二步,分别计算出内的车辆轨迹缺失点P
k
中需填补的特征字段:时间戳T
k
、速度V
k
、方向θ
k
、经度Lon
k
、纬度Lat
k
,其中k=i
‑
m,...,i
‑
1,i+1,...,i+m。具体计算单个特征字段的公式如下所示:第三步,通过步骤(1)中第二步的公式计算出P
k
中需填补的当前车辆加速度a
k
;第四步,对下一个车辆轨迹缺失点P
k+1
重复第一步至第三步,直至缺失点集合Loc
s
内的最后一个车辆轨迹缺失点填补结束;第五步,填补完的缺失点集合Loc
s
与无缺失点集合Loc
A
合并,按照时间戳的顺序,重新编号得到完整车辆轨迹数据集其中P
i*
为填补后的车辆轨迹点,U为完整车辆轨迹数据集中的车辆轨迹点个数。7.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(6)中提到的真实距离检测法,具体实施步骤如下:第一步,以完整车辆轨迹数据集合Loc
*
内的车辆轨迹点P
i*
为基准,找到P
i*
的前一个车辆轨迹点和后一个车辆轨迹点计算P
i*
到的真实距离和P
i*
到的...
【专利技术属性】
技术研发人员:顾工川,曾梦洁,叶建军,万梦怡,欧阳筱青,李煜程,
申请(专利权)人:国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。