一种校正过车数据的方法技术

技术编号:27809229 阅读:15 留言:0更新日期:2021-03-30 09:35
本发明专利技术公开了一种校正过车数据的方法,属于数据处理技术领域。本发明专利技术的方法包括以下步骤:S100、获取历史过车数据,对历史过车数据进行筛选得到历史筛选数据和历史无效数据;S200、对历史筛选数据进行特征提取得到历史特征值,根据历史特征值生成初始特征分布;S300、获取实时过车数据,依据步骤S100和S200对实时过车数据进行处理得到实时特征分布;S400、将实时特征分布与初始特征分布进行融合得到最新特征分布,并将最新特征分布作为初始特征分布;S500、根据最新特征分布对实时无效数据进行校正。本发明专利技术克服了现有技术中,过车数据存在无效数据导致准确性降低的不足,本发明专利技术可以对过车数据中的无效数据进行校正,保证了过车数据的准确性。数据的准确性。数据的准确性。

【技术实现步骤摘要】
一种校正过车数据的方法


[0001]本专利技术属于数据处理
,更具体地说,涉及一种校正过车数据的方法。

技术介绍

[0002]随着汽车业、交通业的发展壮大,过车数据愈来愈多。目前市场上一般都是采用过车识别系统来识别存储过车数据,但是过车识别系统识别产生的过车数据存在很多错误或者残缺的无效数据,这些无效数据愈来愈多,大大降低了过车数据的准确性。如何对有关车辆的无效数据进行处理,是一个值得思考的问题。
[0003]此外,现有的过车识别系统中通过图像识别技术进行识别和校正的准确度不高,大批量识别的速度较慢,识别模式固定不变且不能更新。而深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习可以用来进行数据的识别和建模,对无效数据的有效处理提供了一定的可能性。
[0004]针对车辆无效数据的处理,现有技术中也提出了一些解决方案,例如专利技术创造名称为:一种车辆进场数据校正方法(申请日:2017年11月27日;申请号:201711210738.0),该方案公开了一种车辆进场数据校正方法、设备及计算机可读存储介质,车辆进场数据校正方法包括以下步骤:采集车辆进场数据,并将车辆进场数据存储至第一数据库,且在检测到有车辆停放在车位上时,采集车辆的车位停放数据;从车位停放数据中提取第一车牌信息,并判断第一数据库中是否存在包含第一车牌信息的车辆进场数据;在第一数据库中不存在包含第一车牌信息的车辆进场数据时,根据第一车牌信息对第一数据库中的车辆进场数据进行校正,并将车位停放数据存储至第二数据库。该方案能够极大的提高了车辆进场数据的准确性,有效的减少人工干预次数。但是,该方案仅仅针对车辆进场数据的校正处理,并不能应用至对过车数据的处理。
[0005]综上所述,如何对无效数据进行有效处理,提高过车数据的准确性,是现有技术亟需解决的问题。

技术实现思路

[0006]1.要解决的问题
[0007]本专利技术克服了现有技术中,过车数据中无效数据过多,降低了过车数据准确性的不足,提供了一种校正过车数据的方法,可以对过车数据中的无效数据进行校正,从而可以达到还原真实过车数据的效果,进一步保证了过车数据的准确性。
[0008]2.技术方案
[0009]为了解决上述问题,本专利技术所采用的技术方案如下:
[0010]本专利技术的一种校正过车数据的方法,包括以下步骤:
[0011]S100、获取历史过车数据,对历史过车数据进行筛选得到历史筛选数据和历史无效数据;
[0012]S200、对历史筛选数据进行特征提取得到历史特征值,根据历史特征值生成初始特征分布;
[0013]S300、获取实时过车数据,依据步骤S100对实时过车数据进行筛选得到实时筛选数据和实时无效数据,依据步骤S200对实时筛选数据进行处理得到实时特征分布;
[0014]S400、将实时特征分布与初始特征分布进行融合得到最新特征分布,并将最新特征分布作为初始特征分布;
[0015]S500、根据最新特征分布对实时无效数据进行校正。
[0016]更进一步地,步骤S100中对历史过车数据进行筛选的具体过程为:历史过车数据中每辆车的过车数据包括车牌号、过车时间、过车地点、过车速度和车辆类型,当某辆车的车牌号乱码和/或过车时间延迟或超前N个小时和/或过车地点不在设定的地理列表中和/或过车速度超过道路规定的最高速度的50%或低于道路规定的最低速度的50%和/或车辆类型乱码时,则将该辆车的过车数据筛选为历史无效数据,否则将该辆车的过车数据筛选为历史筛选数据。
[0017]更进一步地,步骤S200中根据历史特征值生成初始特征分布的具体过程为:采用Ksdensity核心平滑密度估计算法对历史特征值进行处理得到初始特征分布。
[0018]更进一步地,步骤S400中将实时特征分布与初始特征分布进行融合的具体过程为:根据历史筛选数据计算得到特征分布权重,再根据初始特征分布、实时特征分布和特征分布权重计算得到最新特征分布。
[0019]更进一步地,计算特征分布权重的过程为:历史筛选数据包括每辆车的过车时间、过车地点、过车速度和车辆类型,计算过车时间、过车地点、过车速度和车辆类型各自对应的最高记录数量和每日平均记录数量的比值,根据比值设置初始时间权重a0、实时时间权重a1、初始地点权重b0、实时地点权重b1,初始速度权重c0、实时速度权重c1,初始类型权重d0和实时类型权重d1。
[0020]更进一步地,通过以下公式计算特征分布权重:过车时间、过车地点、过车速度和车辆类型各自对应的最高记录数量和每日平均记录数量的比值分别为a,b,c,d;a0=a/(a+1),a1=1/(a+1),b0=b/(b+1),b1=1/(b+1),c0=c/(c+1),c1=1/(c+1),d0=d/(d+1)和d1=1/(d+1)。
[0021]更进一步地,计算最新特征分布的具体过程为:初始特征分布包括时间特征分布T0、地点特征分布D0、速度特征分布S0,类型特征分布L0;实时特征分布包括实时时间特征分布T1、实时地点特征分布D1、实时速度特征分布S1,实时类型特征分布L1;
[0022]最新时间特征分布T2=a0*T0+a1*T1,最新地点特征分布D2=b0*D0+b1*D1、最新速度特征分布S2=c0*S0+c1*S1,最新类型特征分布L2=d0*L0+d0*L1。
[0023]更进一步地,步骤S500中对实时无效数据进行校正的具体过程为:
[0024]设定每辆车的车牌号为H、过车时间为G1、过车地点为G2、过车速度为G3和车辆类型为G4,且设定无效数据表示为0,有效数据表示为1;根据每辆车的过车数据的有效数据和无效数据,利用最新特征分布对实时无效数据进行校正。
[0025]更进一步地,若H=1,则将该车辆的最新特征分布的纵坐标最大值对应的横坐标值TX、DX、SX、LX作为该车的过车时间、过车地点、过车速度、类型校正值;
[0026]若H=0,且G1+G2+G3+G4>0,则计算有效性为1的特征值在所有车辆的最新特征分
布中对应的纵坐标值,取纵坐标值最大的特征分布的车辆作为该无效数据的实际车辆,将该车辆的最新特征分布的纵坐标最大值对应的横坐标值TX、DX、SX、LX作为该车的过车时间、过车地点、过车速度、类型校正值;
[0027]若H=0,且G1+G2+G3+G4=0,则计算所有车辆的四种最新特征分布的纵坐标最大值,计算它们平方和的平方根设为N,将最大的N值对应的车辆作为该无效数据的实际车辆,将该车辆的最新特征分布的纵坐标最大值对应的横坐标值TX、DX、SX、LX作为该车的过车时间、过车地点、过车速度、类型校正值。
[0028]3.有益效果
[0029]相比于现有技术,本专利技术的有益效果为:
[0030]本专利技术的一种校正过车数据的方法,通过对过车数据进行处理获取特征分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种校正过车数据的方法,其特征在于,包括以下步骤:S100、获取历史过车数据,对历史过车数据进行筛选得到历史筛选数据和历史无效数据;S200、对历史筛选数据进行特征提取得到历史特征值,根据历史特征值生成初始特征分布;S300、获取实时过车数据,依据步骤S100对实时过车数据进行筛选得到实时筛选数据和实时无效数据,依据步骤S200对实时筛选数据进行处理得到实时特征分布;S400、将实时特征分布与初始特征分布进行融合得到最新特征分布,并将最新特征分布作为初始特征分布;S500、根据最新特征分布对实时无效数据进行校正。2.根据权利要求1所述的一种校正过车数据的方法,其特征在于,步骤S100中对历史过车数据进行筛选的具体过程为:历史过车数据中每辆车的过车数据包括车牌号、过车时间、过车地点、过车速度和车辆类型,当某辆车的车牌号乱码和/或过车时间延迟或超前N个小时和/或过车地点不在设定的地理列表中和/或过车速度超过道路规定的最高速度的50%或低于道路规定的最低速度的50%和/或车辆类型乱码时,则将该辆车的过车数据筛选为历史无效数据,否则将该辆车的过车数据筛选为历史筛选数据。3.根据权利要求1所述的一种校正过车数据的方法,其特征在于,步骤S200中根据历史特征值生成初始特征分布的具体过程为:采用Ksdensity核心平滑密度估计算法对历史特征值进行处理得到初始特征分布。4.根据权利要求1所述的一种校正过车数据的方法,其特征在于,步骤S400中将实时特征分布与初始特征分布进行融合的具体过程为:根据历史筛选数据计算得到特征分布权重,再根据初始特征分布、实时特征分布和特征分布权重计算得到最新特征分布。5.根据权利要求4所述的一种校正过车数据的方法,其特征在于,计算特征分布权重的过程为:历史筛选数据包括每辆车的过车时间、过车地点、过车速度和车辆类型,计算过车时间、过车地点、过车速度和车辆类型各自对应的最高记录数量和每日平均记录数量的比值,根据比值设置初始时间权重a0、实时时间权重a1、初始地点权重...

【专利技术属性】
技术研发人员:吴忠骆乐乐罗达志朱文佳
申请(专利权)人:安徽百诚慧通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1