一种基于mRMR算法与主成分分析的驾驶行为特征提取方法技术

技术编号:30780046 阅读:17 留言:0更新日期:2021-11-16 07:40
本发明专利技术公开了一种基于mRMR算法与主成分分析的驾驶行为特征提取方法,包括,基于车载数据采集终端数据管理系统在线获取运营车辆的车联网数据;预处理所述车联网数据,进行数据清洗工作与指标数据计算;互信息计算每一个所述指标数据,利用指标边缘概率密度与指标联合概率密度计算互信息;利用前向排序法依次计算所述指标数据间的相关性与冗余性,完成mRMR特征重要性排序与选择;结合主成分分析法提取指标中的数据信息,分析得到所述车联网数据中的驾驶行为信息。本发明专利技术减少驾驶行为分析中数据指标间的冗余,同时减少数据维数,以此提高数据使用效率,为更好的利用车联网数据以及提取驾驶行为特征提供了一种有效的工具。取驾驶行为特征提供了一种有效的工具。取驾驶行为特征提供了一种有效的工具。

【技术实现步骤摘要】
一种基于mRMR算法与主成分分析的驾驶行为特征提取方法


[0001]本专利技术涉及车联网数据分析的
,尤其涉及一种基于mRMR算法与主成分分析的驾驶行为特征提取方法。

技术介绍

[0002]随着互联网技术的进步,越来越多的车辆接入了车联网系统,汽车的网联化、智能化程度随之提高。然而如何更有效的使用这些车联网数据对社会与经济做出贡献是当前研究的重点。尤其在使用相关数据进行驾驶行为应用分析时,指标数据在所研究的问题中往往具有所含信息不明确,冗余性大的特点。
[0003]因此,以解决使用车联网数据时具有高维、冗余的问题为出发点,选取特征优化方法对车联网数据进行降维,以及去除数据冗余性。

技术实现思路

[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0005]鉴于上述现有存在的问题,提出了本专利技术。
[0006]因此,本专利技术解决的技术问题是:解决车联网数据使用过程中具有的冗余性问题。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:包括,基于车载数据采集终端与数据管理系统在线获取运营车辆的车联网数据;预处理所述车联网数据,进行数据清洗工作与指标数据计算;互信息计算每一个所述指标数据,利用指标边缘概率密度与指标联合概率密度计算互信息;利用前向排序法依次计算所述指标数据间的相关性与冗余性,完成mRMR特征重要性排序与选择;结合主成分分析法提取指标中的数据信息,分析得到所述车联网数据中的驾驶行为信息。
[0008]作为本专利技术所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的一种优选方案,其中:所述车联网数据包括,车辆识别号、驾驶时间、车辆所在的GPS经度、车辆所在位置的GPS纬度、车辆所在位置的GPS海拔、车辆的ECU总油耗、车辆的累积总油耗、车辆的仪表里程、车辆的ECU车速、车辆的发动机转速、车辆的加速度、车辆的发动机扭矩负荷率、车辆的发动机负荷率。
[0009]作为本专利技术所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的一种优选方案,其中:进行所述数据清洗工作包括,时间跳变检查、数据异常值处理和数据缺失处理;所述指标数据计算包括,对发动机类相关参数及海拔高度进行指标计算,所述指标包括,发动机负荷率均值、发动机扭矩负荷率均值、发动机转速均值、海拔高度均值、发动机负荷率标准差、发动机扭矩负荷率标准差、发动机转速标准差、海拔高度标准差;对驾驶行为类相关参数进行指标计算,所述指标包括,速度均值、加速度均值、油门开度均值、变速箱转速均值、速度标准差、加速度标准差、油门开度标准差、变速箱转速标准差。
[0010]作为本专利技术所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的一种优选方案,其中:计算所述互信息包括,
[0011][0012]其中,I(X,Y)为特征变量X与Y间的互信息量,x、y为数据变量,p(x)和p(y)分别是x和y的边缘概率分布函数,p(x,y)表示x和y的联合概率密度函数。
[0013]作为本专利技术所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的一种优选方案,其中:进行所述mRMR特征重要性排序与选择需计算所述指标数据与目标数据的平均信息相关性,包括,
[0014][0015]其中,S表示特征变量的一个子集,c表示目标变量,f
i
为第i个指标变量,D(S,c)为互信息的平均值。
[0016]作为本专利技术所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的一种优选方案,其中:利用前向排序法依次计算所述指标数据间的相关性与冗余性,包括,
[0017][0018]其中,R(S)为特征子集的最小冗余度量。
[0019]作为本专利技术所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的一种优选方案,其中:计算所述指标数据与目标数据的mRMR特征值及排序包括,
[0020][0021]其中,mRMR为综合最大互信息与最小冗余度的度量。
[0022]作为本专利技术所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的一种优选方案,其中:提取所述指标中的数据信息包括,对所述指标数据进行KMO球型检验和显著性检验;当检验数据符合要求时进行主成分特征提取,包括,计算相关系数矩阵及其对应的特征向量与特征值并表示为主成分;
[0023][0024][0025]其中,k、n表示样本矩阵的维数,x
ij
为样本矩阵中的元素,ρ为标准协方差矩阵,z
i
为提取的的i个主成分,l
ij
为数据矩阵特征向量所包含的元素。
[0026]作为本专利技术所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的一种优选方案,其中:所述驾驶行为信息包括,整合所述mRMR算法所提取的特征与主成分分析所提取的特征。
[0027]本专利技术的有益效果:本专利技术减少驾驶行为分析中数据指标间的冗余,同时减少数据维数,以此提高数据使用效率,为更好的利用车联网数据以及提取驾驶行为特征提供了一种有效的工具。
附图说明
[0028]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0029]图1为本专利技术一个实施例所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的流程示意图;
[0030]图2为本专利技术一个实施例所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的mRMR算法流程示意图;
[0031]图3为本专利技术一个实施例所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法的框架示意图。
具体实施方式
[0032]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本专利技术的具体实施方式做详细的说明,显然所描述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术的保护的范围。
[0033]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是本专利技术还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似推广,因此本专利技术不受下面公开的具体实施例的限制。
[0034]其次,此处所称的“一个实施例”或“实施例”是指可包含于本专利技术至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
[0035]本专利技术结合示意图进行详细描述,在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于mRMR算法与主成分分析的驾驶行为特征提取方法,其特征在于:包括,基于车载数据采集终端数据管理系统在线获取运营车辆的车联网数据;预处理所述车联网数据,进行数据清洗工作与指标数据计算;互信息计算每一个所述指标数据,利用指标边缘概率密度与指标联合概率密度计算互信息;利用前向排序法依次计算所述指标数据间的相关性与冗余性,完成mRMR特征重要性排序与选择;结合主成分分析法提取指标中的数据信息,分析得到所述车联网数据中的驾驶行为信息。2.根据权利要求1所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法,其特征在于:所述车联网数据包括,车辆识别号、驾驶时间、车辆所在的GPS经度、车辆所在位置的GPS纬度、车辆所在位置的GPS海拔、车辆的ECU总油耗、车辆的累积总油耗、车辆的仪表里程、车辆的ECU车速、车辆的发动机转速、车辆的加速度、车辆的发动机扭矩负荷率、车辆的发动机负荷率。3.根据权利要求1或2所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法,其特征在于:进行所述数据清洗工作包括,时间跳变检查、数据异常值处理和数据缺失处理;所述指标数据计算包括,对发动机类相关参数及海拔高度进行指标计算,所述指标包括,发动机负荷率均值、发动机扭矩负荷率均值、发动机转速均值、海拔高度均值、发动机负荷率标准差、发动机扭矩负荷率标准差、发动机转速标准差、海拔高度标准差;对驾驶行为类相关参数进行指标计算,所述指标包括,速度均值、加速度均值、油门开度均值、变速箱转速均值、速度标准差、加速度标准差、油门开度标准差、变速箱转速标准差。4.根据权利要求3所述的基于mRMR算法与主成分分析的驾驶行为特征提取方法,其特征在于:计算所述互信息包括,其中,I(X,Y)为特征变量X与Y间的互信息量,x、...

【专利技术属性】
技术研发人员:何水龙邹智宏李超冯海波许恩永姚柳成王方圆
申请(专利权)人:东风柳州汽车有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1