【技术实现步骤摘要】
一种车联网行驶大数据异常标记方法及电子设备
[0001]本专利技术属于车联网行驶大数据清洗领域,具体涉及一种车联网行驶大数据异常标记方法及电子设备。
技术介绍
[0002]车联网终端由无线发送模块、数据采集器、传感器组成,车辆实时运行情况包括驾驶员的操作行为、动力系统工作参数数据等:由云计算处理平台处理车辆信息,对数据进行数据分析平台负责对数据报表进行处理分析,供后台管理人员查看。
[0003]车联网终端数据涵盖了大规模复杂的数据。数据采集到应用过程中因为传感器异常、传输设备异常、外部环境干扰等原因,会导致数据出现跳变、零点漂移、超值等数值不合理问题。值得注意的是,这些“脏数据”并不具备实际意义,同时也会影响后续数据的质量和分析结果。因此,需要清除车联网海量行驶数据中的异常值、保存有价值的数据。
[0004]传统的车联网行驶数据异常检测方法多依赖于经验规则的总结,即对常见异常数据类型预先进行判断及归纳,并分类制定相应的清洗规则,如对特定字段数据GPS车速设定单一量阈值进行超值“脏数据”判断、对时间错误数据进行异常清洗、对零点漂移数据进行清洗等。然而真实情况复杂多变,异常数据类型的经验判断规则仅对特定情况下极少量的数据通道异常数据才有效,判断条件局限且单一,存在设备数据信息利用率低、异常数据检测结果片面等问题,无法满足海量、高维行驶数据的异常检测工作。
[0005]近年来,随着机器学习算法的研究愈加深入,也有学者将机器学习引入到车联网行驶大数据清洗中,主要包括基于线性模型的异常值检测方法、基于邻 ...
【技术保护点】
【技术特征摘要】
1.一种车联网行驶大数据异常标记方法,其特征在于,包括如下步骤:步骤一、获取某车型车联网行驶数据,并对其进行预处理得到车联网行驶样本数据集;步骤二、构造动力学特征指标,包括动态力观测偏差特征指标以及动态速度观测偏差特征指标;所述的动态力观测偏差特征指标ΔF,计算公式如下:ΔF=F
t
‑
F
f
‑
F
w
‑
F
i
‑
F
j
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,F
t
为驱动力,F
f
为滚动阻力;F
w
为空气阻力;F
i
为坡道阻力;F
j
为加速阻力;所述的动力学特征指标中的动态速度观测偏差特征指标Δv,计算公式如下:其中,v
a
为汽车理论行驶速度,r为车轮半径,n为发动机转速,i
g
为变速器传动比;i0为主减速器传动比;步骤三、构建二维特征状态训练数据集,所述的二维特征状态训练数据集如下:D={ΔF,Δv}
n
×2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)其中,D为构造的二维特征状态训练数据集,n为数据集样本点数;特征维数为2;步骤四、利用孤立森林算法实现异常标记;输入构建的二维特征状态训练数据集并进行缺失值处理;再根据式(10)计算数据集平均异常分数;式中,E(h(x))表示数据x在整个孤立森林路径长度均值,c(n)表示用n条数据构建的二叉树的平均路径长度,ε为算法偏移量为
‑
0.5。再根据平均异常分数结果选取合适的异常分数阈值。2.如权利要求1所述的一种车联网行驶大数据异常标记方法,其特征在于,步骤一所述的车联网行驶数据包括某车型运行状态信息、地图的输出参数和原始数据信息等特征属性。3.如权利要求1所述的一种车联网行驶大数据异常标记方法,其特征在于,步骤一所述的车联网行驶数据预处理包括时间不连续条件下的加速度求解和变速器传动比数据匹配。4.如权利要求...
【专利技术属性】
技术研发人员:施树明,夏孟璇,林楠,岳柄剑,贾素华,刘小姣,陈柏安,
申请(专利权)人:吉林大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。