基于空间和时间的区域网格化驾驶行为数据预处理方法技术

技术编号:26504696 阅读:17 留言:0更新日期:2020-11-27 15:32
本发明专利技术公开一种基于空间和时间的区域网格化驾驶行为数据预处理方法,属于交通数据处理技术领域。该方法从车辆驾驶系统中获取驾驶员行驶过程中的有效数据,并根据GPS获取的经纬度和数据采集的时间,对数据进行清洗与整合;观察汽车的驾驶分布状况,选择不同标准网格大小确定划分区域;在已经划分的每个小区域中,对数据进行均值和方差统计,根据最小方差原则确定网格划分标准;再根据是否是路段高峰期对划分好的小区域进行时间划分,得到基于空间和时间的区域网格化结果。本发明专利技术达到因时、因地而异的效果,使得各个数据特征更加具有可靠性和说服力。

【技术实现步骤摘要】
基于空间和时间的区域网格化驾驶行为数据预处理方法
本专利技术涉及交通数据处理
,尤其涉及一种基于空间和时间的区域网格化驾驶行为数据预处理方法。
技术介绍
随着国家经济和科学技术的不断发展,人们之间的交流越来越密切,生活也越来越方便。于是在这样的背景下,大数据在各领域的应用得到快速发展。数据处理作为从大量原始数据抽取出有价值信息的基本环节极大地影响了后续数据挖掘的广度和深度。数据处理是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某个特定任务来说是有价值、有意义的数据,通过解释并赋予一定意义后就成为了重要信息。数据处理方法包含数据清洗、数据集成、数据变换与数据规约等主体方法。这些方法普遍适用于各个行业各个领域,但因其局限性也不能一成不变的被应用在各种任务中。而汽车行业中的数据包含了车况情况、驾驶员和车外环境等数据,其需要针对具体问题制定合适的研究方法,以收集更好、更智能的信息,用以综合反映驾驶员车辆行驶习惯及风险,为汽车行业发展提供数据支撑。而现阶段该领域数据处理是方法也是多种多样,然而都是基于一维和二维数据的思考。对于大量基于空间和时间的三维不均匀分布数据,在该行业中现存的数据处理方法不能充分提取其有价值信息。目前,网格化方法是应用于统一的城市管理,其将城市管理辖区按照一定的标准划分成为单元网格。通过加强对单元网格的部件和事件巡查,建立一种监督和处置互相分离的形式。其基于空间元素将管理手段数值化,使得对网格内的成员进行多元化和精细化的各种服务功能,让网格化管理的人员,对每个网格进行点对点的单独操作,使各种工作能够细腻地渗透到每一个成员中去。
技术实现思路
针对上述现有技术的不足,提供一种基于空间和时间的区域网格化驾驶行为数据预处理方法。为解决上述技术问题,本专利技术所采取的技术方案是:一种基于空间和时间的区域网格化驾驶行为数据预处理方法,包括如下步骤:步骤1:从数据库中读取驾驶行为相关数据,并根据GPS获取的经纬度和数据采集时间,对数据进行预处理,提升数据的置信度和可靠性,过程如下:步骤1.1:依据GPS精度的准确性,设定经纬度上下阈值,将不在阈值范围内的数据视为异常数据,采用统计方法进行数据清洗;步骤1.2:依据卫星定位技术对定位精度的影响,将少于数据量阈值的数据视为无效数据,再重新进行数据清洗处理。所述数据清洗的统计方法采用逐步向后删除法或均值剔除法或最近邻插值法或重复数据删除法或逻辑错误清洗法。步骤2:针对各个城市的具体位置信息,根据经纬度数据绘制散点图,观察汽车驾驶分布状况,依据不同可能性划分标准划分出m种不同划分标准情况下的区域网格大小,过程如下:步骤2.1:选取某一城市,对其不同采样时间的所有数据进行合并,并根据经纬度画出散点图,观察汽车的驾驶分布状况;步骤2.2:根据散点图密集程度和最大、最小经纬度设置城市网格划分标准,得出其不同划分标准情况下的区域网格大小。步骤2.2.1:根据散点图的分布状况,确定将城市划分为Ni=Li×Wi,(i=1,2,3,…,m)个区域,其中m表示划分网格有m种可能性标准;步骤2.2.2:假设该城市的最大、最小经度分别为max(X)、min(X),最大、最小纬度分别为max(Y)、min(Y),计算每种可能性划分标准下,每个小区域的长度、宽度分别为:其中,lengthi表示第i种可能性划分标准下网格划分的每个小区域的长度,widthi表示第i种可能性划分标准下网格划分的每个小区域的宽度。步骤3:计算和汇总m种不同可能性划分标准下各区域数据的均值和方差,依据最小方差原则,在m种不同可能性划分标准中确定方差最小的为最优网格划分标准,过程如下:步骤3.1:获取各区域中的数据,并对驾驶行为中车辆运行数据进行均值和方差的汇总;步骤3.2:将m种不同可能性划分标准下各区域车辆运行数据的方差相加,依据最小方差法,在m种不同可能性划分标准中确定方差最小的为最优网格划分标准。为了避免出现大量的无数据区域,所述步骤3的过程还包括:针对每个城市的小区域,根据小区域内的方差采用投票法进行调整,以避免出现大量的无数据区域。步骤4:对在最优网格划分标准下已经划分好的每个空间小区域,根据是否是路段高峰期进行时间划分。经过步骤1至步骤4的预处理后,可再分别对数据进行均值和方差统计计算,根据方差对经空间和时间的区域网格化划分驾驶数据进行分类,对不同类型的数据采用不同的数据处理和分析方式,实现对不同区域不同时间段的驾驶行为相关数据进行不同的处理。采用上述技术方案所产生的有益效果在于:1、本专利技术合理地将网格化方法和空间元素、时间元素、数据处理相结合,能够在充分考虑高峰时期和拥堵路段的情况下,对不同区域不同时间段的驾驶行为相关数据进行不同的处理,从而达到了因时、因地而异的效果,使得各网格数据之间彼此分离而又相关,并大大提高了数据挖掘模式的质量,降低实际挖掘所需要的时间。2、本专利技术提出的方法综合考虑了不同可能性划分标准下的划分情况,考虑其数据特点,选取驾驶行为中有价值的数据进行均值和方差统计,选取最优划分标准。附图说明图1为本专利技术实施例中基于空间和时间的区域网格化驾驶行为数据预处理方法流程图;图2为本专利技术实施例中四种可能的划分标准下的空间网格图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。如图1所示,本实施例的方法如下所述。步骤1:从数据库中读取驾驶行为相关数据,并根据GPS获取的经纬度和数据采集时间,对数据进行预处理,提升数据的置信度和可靠性,过程如下:步骤1.1:依据GPS精度的准确性,设定经纬度上下阈值,将不在阈值范围内的数据视为异常数据,采用统计方法进行数据清洗;步骤1.2:依据卫星定位技术对定位精度的影响,将少于数据量阈值的数据视为无效数据,再重新进行数据清洗处理。所述数据清洗的统计方法采用逐步向后删除法或均值剔除法或最近邻插值法或重复数据删除法或逻辑错误清洗法。本实施例中从车辆驾驶系统中获取驾驶员行驶过程中的车况情况、驾驶员行为和车外环境等数据进行分析处理。步骤2:针对各个城市的具体位置信息,根据经纬度数据绘制散点图,观察汽车驾驶分布状况,依据不同可能性划分标准划分出m种不同划分标准情况下的区域网格大小,过程如下:步骤2.1:选取某一城市,对其不同采样时间的所有数据进行合并,并根据经纬度画出散点图,观察汽车的驾驶分布状况;步骤2.2:根据散点图密集程度和最大、最小经纬度设置城市网格划分标准,得出其不同划分标准情况下的区域网格大小。步骤2.2.1:根据散点图的分布状况,确定将城市划分为Ni=Li×Wi,(i=1,2,3,…,m)个区域,其中m表示划分网格有m种可能性标准;步骤2.2.2:假本文档来自技高网
...

【技术保护点】
1.一种基于空间和时间的区域网格化驾驶行为数据预处理方法,其特征在于:包括如下步骤:/n步骤1:从数据库中读取驾驶行为相关数据,并根据GPS获取的经纬度和数据采集时间,对数据进行预处理,提升数据的置信度和可靠性;/n步骤2:针对各个城市的具体位置信息,根据经纬度数据绘制散点图,观察汽车驾驶分布状况,依据不同可能性划分标准划分出m种不同划分标准情况下的区域网格大小;/n步骤3:计算和汇总m种不同可能性划分标准下各区域数据的均值和方差,依据最小方差原则,在m种不同可能性划分标准中确定方差最小的为最优网格划分标准;/n步骤4:对在最优网格划分标准下已经划分好的每个空间小区域,根据是否是路段高峰期进行时间划分。/n

【技术特征摘要】
1.一种基于空间和时间的区域网格化驾驶行为数据预处理方法,其特征在于:包括如下步骤:
步骤1:从数据库中读取驾驶行为相关数据,并根据GPS获取的经纬度和数据采集时间,对数据进行预处理,提升数据的置信度和可靠性;
步骤2:针对各个城市的具体位置信息,根据经纬度数据绘制散点图,观察汽车驾驶分布状况,依据不同可能性划分标准划分出m种不同划分标准情况下的区域网格大小;
步骤3:计算和汇总m种不同可能性划分标准下各区域数据的均值和方差,依据最小方差原则,在m种不同可能性划分标准中确定方差最小的为最优网格划分标准;
步骤4:对在最优网格划分标准下已经划分好的每个空间小区域,根据是否是路段高峰期进行时间划分。


2.根据权利要求1所述的基于空间和时间的区域网格化驾驶行为数据预处理方法,其特征在于:所述步骤1的过程如下:
步骤1.1:依据GPS精度的准确性,设定经纬度上下阈值,将不在阈值范围内的数据视为异常数据,采用统计方法进行数据清洗;
步骤1.2:依据卫星定位技术对定位精度的影响,将少于数据量阈值的数据视为无效数据,再重新进行数据清洗处理。


3.根据权利要求2所述的基于空间和时间的区域网格化驾驶行为数据预处理方法,其特征在于:所述数据清洗的统计方法采用逐步向后删除法或均值剔除法或最近邻插值法或重复数据删除法或逻辑错误清洗法。


4.根据权利要求1所述的基于空间和时间的区域网格化驾驶行为数据预处理方法,其特征在于:所述步骤2的过程如下:
步骤2.1:选取某一城市,对其不同采样时间的所有数据进行合并,并根据经纬度画...

【专利技术属性】
技术研发人员:郑泉刘洋
申请(专利权)人:睿驰达新能源汽车科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1