一种车辆轨迹数据清洗与校准方法技术

技术编号:32510724 阅读:23 留言:0更新日期:2022-03-02 10:54
本发明专利技术公开了一种车辆轨迹数据清洗与校准方法,该方法包括以下步骤:建立包含特征字段的车辆轨迹数据样本;对车辆轨迹数据样本进行去重;选取所需检测的特征字段;对所需检测的特征字段进行缺失点排查;对车辆轨迹缺失点的特征字段进行数据填补;依据真实距离检测法对车辆轨迹数据样本进行车辆轨迹离群点标识;根据车辆轨迹数据样本中的初始数据对车辆轨迹离群点进行修正。与现有技术相比,本发明专利技术的优点在于:该方法修正了离群轨迹对车辆轨迹数据的影响,清洗后的数据质量能更加真实地反映出该车辆的行驶状态,更准确地统计到车辆的各项属性,减少之后数据分析的偏差,从而为后续制定对应的车辆安全操作时提供准确的数据。制定对应的车辆安全操作时提供准确的数据。制定对应的车辆安全操作时提供准确的数据。

【技术实现步骤摘要】
一种车辆轨迹数据清洗与校准方法


[0001]本专利技术涉及车辆数据处理领域,尤其是涉及一种车辆轨迹数据清洗与校准方法。

技术介绍

[0002]在车辆行驶的过程中,车辆采集器需采集的数据量较大,这些数据能为车辆方面的应用提供有效价值,例如车辆行驶过程异常监控、车辆行驶效率评估、路线的调整与规划等等。但车辆采集器在采集数据的过程中,有时会因地形阻碍、信号不稳定、信道堵塞等诸多不可避免的因素影响到车辆行驶数据的质量,例如出现缺失点、重复点、离群点等异常数据。因此在对车辆行驶数据进行数据分析之前,数据的清洗是关键所在。
[0003]数据清洗的过程中,最为重要的环节是异常值检测和处理,针对轨迹类数据,常采用的方法是均值滤波、密度聚类等。不同的轨迹数据应选择合适的方法进行处理。如名称为“基于局部遍历密度聚类的ADS

B航迹清洗与校准方法”(公开号为CN110362559A)的专利技术专利,是将航行轨迹数据通过局部遍历密度聚类算法对速度、经度、纬度、压力高度等字段进行清洗与校准,使航行轨迹数据内的航迹点满足质点运动学规律,但车辆行驶数据不同于航迹数据,大部分不会受到压力、气流等影响。如名称为“一种基于路网数据的GPS轨迹清洗方法”(公开号为CN112748452A)的专利技术专利,利用城市路网空间数据,优化GPS清洗数据,使得对异常值的剔除和跳跃点之间的补植更符合真实情况,该方法虽然能将速度与经度和纬度的结合进行清洗,但直接剔除异常值会对车辆安全的性能检测有较大的影响,不能为后续对车辆行驶异常进行检测提供有效数据。

技术实现思路

[0004]本专利技术的目的在于提供一种对车辆轨迹数据中存在的隐患数据进行清洗、为后续对车辆的性能进行数据分析提供支撑依据的车辆轨迹数据清洗与校准方法。
[0005]本专利技术的目的是这样实现的:
[0006]一种车辆轨迹数据清洗与校准方法,特征是:具体步骤如下:
[0007](1)建立包含特征字段的车辆轨迹数据样本,其中特征字段由初始字段和扩展字段组成,所述初始字段由车辆行程采集器获取,所述扩展字段由所述初始字段计算得出;
[0008](2)对车辆轨迹数据样本进行去重;
[0009](3)选取所需检测的特征字段;
[0010](4)对所需检测的特征字段进行缺失点排查;
[0011](5)对车辆轨迹缺失点的特征字段进行数据填补;
[0012](6)依据真实距离检测法对车辆轨迹数据样本进行车辆轨迹离群点标识;
[0013](7)根据车辆轨迹数据样本中的初始数据对车辆轨迹离群点进行修正。
[0014]上述步骤(1)中建立包含特征字段的车辆轨迹数据样本,具体操作过程如下:
[0015](1.1)建立包含特征字段的车辆轨迹数据样本,车辆轨迹数据样本由N个车辆轨迹点组成,将该车辆轨迹数据样本表示为Loc={P1,P2,...,P
N
},i=1,2,...,N,其中P
i
表示第
i个车辆轨迹点,N为车辆轨迹数据中车辆轨迹点的个数;车辆轨迹点P
i
具体包括的初始字段有:车牌号ID
i
、时间戳T
i
、速度V
i
、方向θ
i
、经度Lon
i
、纬度Lat
i
以及所属单位Cor
i
,车辆轨迹点P
i
具体包括的扩展字段有:当前车辆加速度a
i

[0016](1.2)扩展字段内的当前车辆加速度a
i
由所述初始字段计算得出。具体计算当前车辆加速度a
i
的公式如下所示:
[0017][0018]上述步骤(2)中对车辆轨迹数据样本进行去重,具体操作过程如下:
[0019](2.1)根据时间戳T
i
的顺序,对车辆轨迹数据样本内的车辆轨迹点P
i
进行排序;
[0020](2.2)以时间戳T
i
为基准,找到与时间戳T
i
相等的所有车辆轨迹点,将这些车辆轨迹点从Loc内除去并加入至车辆轨迹时间重复数据集Loc'中;若Loc'内的车辆轨迹点P
i
为时间戳的起始点,则计算出该车辆轨迹点到后一个时间戳下的车辆轨迹点P
x
的欧氏距离;若Loc'内的车辆轨迹点P
i
为时间戳的结束点,则计算出该车辆轨迹点到前一个时间戳内的车辆轨迹点P
y
的欧氏距离。具体的欧氏距离公式如下所示:
[0021][0022]其中,m,n为需要计算欧氏距离的两个车辆轨迹点的下标;同理,计算出Loc'内所有车辆轨迹点的欧氏距离,将Loc'内欧氏距离最小的车辆轨迹点作为该时间戳下的车辆轨迹点;
[0023](2.3)将Loc'内的车辆轨迹点与被提取后的Loc进行合并,根据时间戳的顺序重新编号,得到去重后的车辆轨迹数据样本Loc
d
={P1,P2,...,P
M
},其中M为去重后的车辆轨迹数据中车辆轨迹点个数。
[0024]上述步骤(3)中选取所需检测的特征字段,具体操作过程如下:
[0025](3.1)根据采集的数据样本为一辆车的某一时间段的车辆轨迹数据,选取所需检测的特征字段包括:时间戳T、速度V、方向θ、经度Lon、纬度Lat以及当前车辆加速度a。
[0026]上述步骤(4)中对于所需检测的特征字段进行缺失点排查,具体操作过程如下:
[0027](4.1)依据采集器设定的采集时间间隔t,对车辆轨迹数据样本Loc
d
={P1,P2,...,P
M
}中的任意车辆轨迹点P
i
进行检测,若P
i
中存在缺失的特征字段,则将P
i
标记为车辆轨迹缺失点,并将该车辆轨迹缺失点P
i
加入缺失车辆轨迹域S中;若P
i
中不存在缺失的特征字段,则将P
i
加入无缺失车辆轨迹域A中;
[0028](4.2)对下一个车辆轨迹点P
i+1
重复(4.1),直至最后一个车辆轨迹点P
N
检测结束;
[0029](4.3)将缺失车辆轨迹域S内的所有车辆轨迹缺失点进行合并得到缺失点集合其中a≠b;将无缺失车辆轨迹域A内的所有车辆轨迹点进行合并得到无缺失点集合
[0030]上述步骤(5)中对车辆轨迹缺失点的特征字段进行数据填补,具体操作过程如下:
[0031](5.1)以缺失点集合Loc
s
内的车辆轨迹缺失点P
i
为填补对象,在无缺失点集合Loc
A
内以i为中心点下标,前后各获取m个车辆轨迹点,将该组数据记为
[0032](5.2)分别计算出内的车辆轨迹缺失点P<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车辆轨迹数据清洗与校准方法,其特征在于:具体步骤如下:(1)建立包含特征字段的车辆轨迹数据样本,其中特征字段由初始字段和扩展字段组成,所述初始字段由车辆行程采集器获取,所述扩展字段由所述初始字段计算得出;(2)对车辆轨迹数据样本进行去重;(3)选取所需检测的特征字段;(4)对所需检测的特征字段进行缺失点排查;(5)对车辆轨迹缺失点的特征字段进行数据填补;(6)依据真实距离检测法对车辆轨迹数据样本进行车辆轨迹离群点标识;(7)根据车辆轨迹数据样本中的初始数据对车辆轨迹离群点进行修正。2.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(1)中建立包含特征字段的车辆轨迹数据样本,具体操作过程如下:第一步,建立包含特征字段的车辆轨迹数据样本,车辆轨迹数据样本由N个车辆轨迹点组成,将该车辆轨迹数据样本表示为Loc={P1,P2,...,P
N
},i=1,2,...,N,其中P
i
表示第i个车辆轨迹点,N为车辆轨迹数据中车辆轨迹点的个数;车辆轨迹点P
i
具体包括的初始字段有:车牌号ID
i
、时间戳T
i
、速度V
i
、方向θ
i
、经度Lon
i
、纬度Lat
i
以及所属单位Cor
i
,车辆轨迹点P
i
具体包括的扩展字段有:当前车辆加速度a
i
;第二步,扩展字段内的当前车辆加速度a
i
由所述初始字段计算得出。具体计算当前车辆加速度a
i
公式如下所示:3.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(2)中对车辆轨迹数据样本进行去重,具体操作过程如下:第一步,根据时间戳T
i
的顺序,对车辆轨迹数据样本内的车辆轨迹点P
i
进行排序;第二步,以时间戳T
i
为基准,找到与时间戳T
i
相等的所有车辆轨迹点,将这些车辆轨迹点从Loc内除去并加入至车辆轨迹时间重复数据集Loc'中;若Loc'内的车辆轨迹点P
i
为时间戳的起始点,则计算出该车辆轨迹点到后一个时间戳下的车辆轨迹点P
x
的欧氏距离;若Loc'内的车辆轨迹点P
i
为时间戳的结束点,则计算出该车辆轨迹点到前一个时间戳内的车辆轨迹点P
y
的欧氏距离;具体的欧氏距离公式如下所示:其中,m,n为需要计算欧氏距离的两个车辆轨迹点的下标;同理,计算出Loc'内所有车辆轨迹点的欧氏距离,将Loc'内欧氏距离最小的车辆轨迹点作为该时间戳下的车辆轨迹点;第三步,将Loc'内的车辆轨迹点与被提取后的Loc进行合并,根据时间戳的顺序重新编号,得到去重后的车辆轨迹数据样本Loc
d
={P1,P2,...,P
M
},其中M为去重后的车辆轨迹数据中车辆轨迹点个数。4.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(3)中选取所需检测的特征字段,具体操作过程如下:第一步,根据采集的数据样本为一辆车的某一时间段的车辆轨迹数据,选取所需检测
的特征字段包括:时间戳T、速度V、方向θ、经度Lon、纬度Lat以及当前车辆加速度a。5.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(4)中对于所需检测的特征字段进行缺失点排查,具体操作过程如下:第一步,依据采集器设定的采集时间间隔t=15(单位:秒),对车辆轨迹数据样本Loc
d
={P1,P2,...,P
M
}中的任意车辆轨迹点P
i
进行检测,若P
i
中存在缺失的特征字段,则将P
i
标记为车辆轨迹缺失点,并将该车辆轨迹缺失点P
i
加入缺失车辆轨迹域S中;若P
i
中不存在缺失的特征字段,则将P
i
加入无缺失车辆轨迹域A中;第二步,对下一个车辆轨迹点P
i+1
重复第一步,直至最后一个车辆轨迹点P
N
检测结束;第三步,将缺失车辆轨迹域S内的所有车辆轨迹缺失点进行合并得到缺失点集合其中a≠b;将无缺失车辆轨迹域A内的所有车辆轨迹点进行合并得到无缺失点集合6.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(5)中对车辆轨迹缺失点的特征字段进行数据填补,具体操作过程如下:第一步,以缺失点集合Loc
s
内的车辆轨迹缺失点P
i
为填补对象,在无缺失点集合Loc
A
内以i为中心点下标,前后各获取m个车辆轨迹点,将该组数据记为第二步,分别计算出内的车辆轨迹缺失点P
k
中需填补的特征字段:时间戳T
k
、速度V
k
、方向θ
k
、经度Lon
k
、纬度Lat
k
,其中k=i

m,...,i

1,i+1,...,i+m。具体计算单个特征字段的公式如下所示:第三步,通过步骤(1)中第二步的公式计算出P
k
中需填补的当前车辆加速度a
k
;第四步,对下一个车辆轨迹缺失点P
k+1
重复第一步至第三步,直至缺失点集合Loc
s
内的最后一个车辆轨迹缺失点填补结束;第五步,填补完的缺失点集合Loc
s
与无缺失点集合Loc
A
合并,按照时间戳的顺序,重新编号得到完整车辆轨迹数据集其中P
i*
为填补后的车辆轨迹点,U为完整车辆轨迹数据集中的车辆轨迹点个数。7.根据权利要求1所述的车辆轨迹数据清洗与校准方法,其特征在于,上述步骤(6)中提到的真实距离检测法,具体实施步骤如下:第一步,以完整车辆轨迹数据集合Loc
*
内的车辆轨迹点P
i*
为基准,找到P
i*
的前一个车辆轨迹点和后一个车辆轨迹点计算P
i*
到的真实距离和P
i*
到的...

【专利技术属性】
技术研发人员:顾工川曾梦洁叶建军万梦怡欧阳筱青李煜程
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1