【技术实现步骤摘要】
时间序列缺失填充方法、装置、设备及可读存储介质
[0001]本专利技术涉及数据处理领域,尤其涉及一种时间序列缺失填充方法、装置、设备及可读存储介质。
技术介绍
[0002]车辆大数据系统是以终端车辆的数据为核心,实现多源海量车辆数据信息的联网接入、分析处理、云存储、智能研判及可视化展示的车辆大数据研判挖掘平台,数据的质量决定了数据的可用性,是平台进行后续分析挖掘的基础,其中,终端车辆的数据是典型的时序数据,在实际操作过程中,由于各种原因而导致接收到的终端车辆的数据存在数据的事件时间(即数据中记录终端车辆的事件的发生时刻)缺失的情况,造成时间序列(即按时间顺序的一系列数据的集合)的缺失不完整,例如终端故障、网络信号、接入系统故障等原因,进而会导致平台在后续的数据处理过程中的各种指标的计算失真。
技术实现思路
[0003]本专利技术的主要目的在于提供一种时间序列缺失填充方法、装置、设备及可读存储介质,旨在解决数据的时间序列缺失而未能得到高精度填充的技术问题。
[0004]第一方面,本专利技术提供一种时间序 ...
【技术保护点】
【技术特征摘要】
1.一种时间序列缺失填充方法,其特征在于,所述时间序列缺失填充方法包括:若从终端接收到的数据的事件时间缺失,则将接收到的事件时间缺失的数据作为待填充数据;从接收到的多条数据中选取所述待填充数据的参考数据集;将所述参考数据集作为参考,通过计算得到所述待填充数据的延迟时间;基于所述待填充数据的延迟时间,结合所述待填充数据的接收时刻,计算得到所述待填充数据的缺失时间;使用所述待填充数据的缺失时间对所述待填充数据的事件时间进行填充。2.如权利要求1所述的时间序列缺失填充方法,其特征在于,所述从接收到的多条数据中选取所述待填充数据的参考数据集包括:基于终端发送数据的频率,确定所述待填充数据的参考数据集的数据数量N;在实时数据处理场景下,从接收到的多条数据中,选取与所述待填充数据相邻的前N条时间序列完整的数据作为所述待填充数据的参考数据集;在离线数据处理场景下,从接收到的多条数据中,选取与所述待填充数据相邻的前N条和后N条时间序列完整的数据作为所述待填充数据的参考数据集。3.如权利要求2所述的时间序列缺失填充方法,其特征在于,所述基于终端发送数据的频率,确定所述待填充数据的参考数据集的数据数量N包括:根据所述待填充数据,通过查询获得终端发送数据的频率;基于终端发送数据的频率,通过公式确定所述待填充数据的参考数据集的数据数量N,确定公式为:其中,t为终端每发送一条数据的间隔时间,m为1秒内终端发送数据的条数。4.如权利要求2或3所述的时间序列缺失填充方法,其特征在于,所述将所述参考数据集作为参考,通过计算得到所述待填充数据的延迟时间包括:将所述参考数据集作为参考,基于所述参考数据集中数据的发生时刻和接收时刻,通过计算得到所述待填充数据的延迟时间,计算公式为:其中,δ为所述待填充数据的延迟时间,T
i
为所述参考数据集中数据i的发生时刻,C
i
为所述参考数据集中数据i的接收时刻,N为所述待填充数据的参考数据集的数据数量。5.如权利要求1所述的时间序列缺失填充方法,其特征在于,所述基于所述待填充数据的延迟时间,结合所述待填充数据的接收时刻,计算得到所述待填充数据的缺失时间包括:基于所述待填充数据的延迟时间,结合所述待填充数据的接收时刻,计算得到所述待填充数据的缺失时间,计算公式为:T
f
=C
...
【专利技术属性】
技术研发人员:龚浩,李晓聪,王浩东,陈付,姚树为,
申请(专利权)人:南斗六星系统集成有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。