当前位置: 首页 > 专利查询>吉林大学专利>正文

用于估算汽车质量的有效数据的筛选方法技术

技术编号:20867795 阅读:22 留言:0更新日期:2019-04-17 09:36
本发明专利技术属于汽车安全驾驶技术领域,特别是涉及一种用于估算汽车质量的有效数据的筛选方法,包括以下步骤:步骤一:建立能够对数据进行分类的分类器模型,在模型中输入数据时,模型会将该数据归类为“好数据”或“坏数据”;步骤二:利用分类器模型对车辆所采集到的数据实时进行分类,将归为“好数据”的数据筛选出来,作为可用于估算汽车质量的有效数据。步骤一中的分类器模型的建立过程如下:1)定义“好数据”和“坏数据”的分类依据;2)根据分类依据对建模用原始数据进行分类;3)在影响汽车质量的变量中选取出能够作为区分“好数据”和“坏数据”的特征变量;4)基于多决策树随机组合分类算法对训练数据进行训练,生成分类器模型。

【技术实现步骤摘要】
用于估算汽车质量的有效数据的筛选方法
本专利技术属于汽车安全驾驶
,特别是涉及一种用于估算汽车质量的有效数据的筛选方法。
技术介绍
汽车的重量参数包括整备质量、载质量、总质量等,其中整备质量是指整车装备质量,即汽车无乘员或不载货时(仅带有工具、备胎)加满燃油和冷却水时的重量;核定载质量是指该车辆设计规定装载货物的标准质量;汽车总质量则是指汽车装备齐全,并按规定装满客(包括驾驶员)、货时的重量。根据汽车理论的相关内容可知,汽车总质量会直接或间接影响汽车的动力性、经济性、操纵稳定性、制动性、通过性等,同时依据交通运输管理的相关规定,汽车总质量应限制在一定范围内,因此需要根据车辆实时采集到的数据对汽车质量进行估算,避免因超载而导致潜在的危险。在车辆运行过程中,当车辆发生转向、制动或处于空挡、离合器接合等状态时,发动机转矩、车速、加速度等车辆数据并不满足汽车行驶方程式,即车辆采集到的数据并非全部可以直接用于估算汽车质量。汽车质量由行驶方程式计算得到,满足汽车行驶方程式、能够较好地估算车辆质量的有效数据为需要筛选出来的“好”数据;而不满足上述条件的无效数据则为需要筛选出来的“坏”数据。因此,如何经过一系列筛选得到“好”数据是估算汽车质量的重要一步。另外,车辆运行过程中可采集到的数据一般包括经纬度、海拔高度、转向盘方向、速度、发动机转速、发动机扭矩、离合器工作状态、制动器工作状态、燃油消耗率、油门踏板开度、水温、进气管温度、进气管压力等变量,而这些变量中并非所有变量都可以代表汽车质量的特征属性。如何找到汽车质量的特征变量,即找到能够作为筛选出“好/坏”数据的特征变量,成为数据筛选的必需工作。再者,由于采集到的数据有“好”、“坏”之分,相当于构造一个分类器将数据一分为二,此时涉及到数据挖掘中的分类算法分析。分类数据挖掘是通过找出共同事物的相同属性及不同事物间的差异,利用找出的相同点或者不同点将事物分类。分类算法通常是基于决策树来实现,算法简单,当数据量较大时仍能快速地将数据进行分类。决策树中最顶部的决策节点是根决策节点,每一个分支都有一个新的决策节点,中间的节点用于表示事物的属性;决策节点下面是叶子节点,用叶子节点表示设定的分类种类。整个决策的过程从根决策节点开始,从上到下。由于决策树会产生过拟合现象,导致泛化能力变弱,因而针对初步筛选后的车辆数据,基于选取的特征变量,如何构造合适的分类器将“好”、“坏”数据合理得区分开,同时避免过拟合问题以提高分类器的准确性也成为需要解决的问题之一。
技术实现思路
本专利技术的目的是至少解决上述现有技术中存在的问题之一,该目的是通过以下技术方案实现的:本专利技术提出了一种用于估算汽车质量的有效数据的筛选方法,包括以下步骤:步骤一:建立能够对数据进行分类的分类器模型,当在分类器模型中输入用于估算汽车质量的数据时,分类器模型会将该数据归类为“好数据”或“坏数据”;步骤二:利用步骤一所建立的分类器模型对车辆所采集到的数据实时进行分类,并将归为“好数据”一类的数据筛选出来,以作为可用于估算汽车质量的有效数据;其中,所述步骤一中的分类器模型的建立过程如下:1)定义“好数据”和“坏数据”的分类依据;2)根据步骤1)所定义的分类依据对建模用原始数据进行分类;3)在影响汽车质量的变量中选取出能够代表汽车质量的特征属性,作为区分“好数据”和“坏数据”的特征变量;4)基于多决策树随机组合分类算法对训练数据进行训练,从而生成分类器模型,其中,训练过程以建模用原始数据作为训练数据,以训练数据的特征变量作为训练样本集,以数据的类别作为候选属性集合。进一步地,所述步骤1)中的“好数据”定义为:满足汽车行驶方程式,并且代入汽车行驶方程式后所得到的质量与汽车实际质量之间的误差不超过5%的数据;不满足“好数据”定义的数据则定义为“坏数据”。进一步地,在步骤1)与步骤2)之间增加对建模用原始数据进行初步筛选的步骤,在初步筛选步骤中剔除掉的数据不参与步骤2)-步骤4),初步筛选的过程为:筛选出汽车未发生转向、离合器分离、制动器未发生制动、实际档位为非空挡状态时所采集的数据,剔除掉其余数据。进一步地,汽车行驶方程式为:其中,m为汽车质量,Ttq为发动机转矩,ig为变速器传动比,i0为主减速比,η为机械传动效率,r为车轮滚动半径,f为滚动阻力摩擦系数,α为坡度角,CD为风阻系数,A为迎风面积,ua为车速,du/dt为加速度,δ为旋转质量换算系数,g为重力加速度,Ft为汽车行驶的驱动力。进一步地,所述步骤3)所选取出的特征变量为5个,分别是:速度、发动机扭矩、加速度、传动比、油门开度变化。进一步地,选取出所述5个特征变量所采用的方法为因子分析法,选取出所述5个特征变量的过程如下:基于汽车行驶方程式中涉及的参数,对汽车质量估算产生影响的因素主要包括:发动机扭矩、燃料消耗率、油门开度、油门开度变化、速度、实际档位、加速度、传动比;先对燃料消耗率、油门开度、发动机扭矩、加速度、油门开度变化5个变量进行因子分析,提取出1个公因子,进而获得该公因子与各变量之间的系数,根据该系数选取出发动机扭矩、加速度、油门开度变化3个变量作为特征变量;再对速度、实际档位、传动比3个变量进行因子分析,提取出1个公因子,进而获得该公因子与各变量之间的系数,根据该系数选取出速度、传动比2个变量作为特征变量。进一步地,所述步骤4)中单一决策树的生成方法为:设训练样本集合为P_train,候选属性集合为M_train,具体流程如下:①创建决策树的根节点N,若所有样本均属于同一类别C,则返回N作为一个叶子节点,并标志为C类别;若M_train为空,则返回N作为一个叶子节点,并标志该节点所含样本中类别最多的类别;②计算M_train集合中各个候选属性的信息增益率,选择最大的信息增益率对应的属性M,标记为根节点N;③根据属性M值域中的每个值Vi,从根节点N产生相应的一个分支,并记xi为P_train集合中满足M=Vi条件的样本子集合;④若xi为空,则将相应的叶子节点标志为P_train样本集合中类别最多的类别;否则,将属性M从M_train中删除,返回①。⑤重复①~④,递归创建子树,即形成分支,直到数据样本集不可分,决策树停止生长。进一步地,所述步骤4)中的多决策树随机组合是在原始数据中以每次有放回的方式抽取一个样本,抽取n次形成新的集合S′,重复实施L次该取样过程,以随机产生L个训练集S1,S2,…,SL,针对每个训练集,根据步骤一所述流程①~⑤生成对应的决策树C1,C2,…,CL,其中每一棵决策树之间并无关联;在每个非叶子节点上选择属性之前,从5个属性中随机抽取m(0<m<5,m∈N*)个属性作为当前节点的分类属性集,并以这m个属性中最好的分裂方式对该节点进行分裂。进一步地,利用分类器模型对数据进行分类时,先利用每个决策树进行测试,得到对应的类别C1(X),C2(X),…,CL(X),采用投票的方法,将L个决策树中输出最多的类别作为分类结果。进一步地,完成所述步骤4)后,选用一部分经过初步筛选的原始数据作为测试样本集,该部分原始数据未参与分类器模型的训练生成,利用分类器模型对测试样本集中的数据归类,并且计算得到分类的正确率。本专利技术的优点在于:1本文档来自技高网
...

【技术保护点】
1.一种用于估算汽车质量的有效数据的筛选方法,包括以下步骤:步骤一:建立能够对数据进行分类的分类器模型,当在分类器模型中输入用于估算汽车质量的数据时,分类器模型会将该数据归类为“好数据”或“坏数据”;步骤二:利用步骤一所建立的分类器模型对车辆所采集到的数据实时进行分类,并将归为“好数据”一类的数据筛选出来,以作为可用于估算汽车质量的有效数据;其中,所述步骤一中的分类器模型的建立过程如下:1)定义“好数据”和“坏数据”的分类依据;2)根据步骤1)所定义的分类依据对建模用原始数据进行分类;3)在影响汽车质量的变量中选取出能够代表汽车质量的特征属性,作为区分“好数据”和“坏数据”的特征变量;4)基于多决策树随机组合分类算法对训练数据进行训练,从而生成分类器模型,其中,训练过程以建模用原始数据作为训练数据,以训练数据的特征变量作为训练样本集,以数据的类别作为候选属性集合。

【技术特征摘要】
1.一种用于估算汽车质量的有效数据的筛选方法,包括以下步骤:步骤一:建立能够对数据进行分类的分类器模型,当在分类器模型中输入用于估算汽车质量的数据时,分类器模型会将该数据归类为“好数据”或“坏数据”;步骤二:利用步骤一所建立的分类器模型对车辆所采集到的数据实时进行分类,并将归为“好数据”一类的数据筛选出来,以作为可用于估算汽车质量的有效数据;其中,所述步骤一中的分类器模型的建立过程如下:1)定义“好数据”和“坏数据”的分类依据;2)根据步骤1)所定义的分类依据对建模用原始数据进行分类;3)在影响汽车质量的变量中选取出能够代表汽车质量的特征属性,作为区分“好数据”和“坏数据”的特征变量;4)基于多决策树随机组合分类算法对训练数据进行训练,从而生成分类器模型,其中,训练过程以建模用原始数据作为训练数据,以训练数据的特征变量作为训练样本集,以数据的类别作为候选属性集合。2.根据权利要求1所述的用于估算汽车质量的有效数据的筛选方法,其特征在于,所述步骤1)中的“好数据”定义为:满足汽车行驶方程式,并且代入汽车行驶方程式后所得到的质量与汽车实际质量之间的误差不超过5%的数据;不满足“好数据”定义的数据则定义为“坏数据”。3.根据权利要求2所述的用于估算汽车质量的有效数据的筛选方法,其特征在于,在步骤1)与步骤2)之间增加对建模用原始数据进行初步筛选的步骤,在初步筛选步骤中剔除掉的数据不参与步骤2)-步骤4),初步筛选的过程为:筛选出汽车未发生转向、离合器分离、制动器未发生制动、实际档位为非空挡状态时所采集的数据,剔除掉其余数据。4.根据权利要求2所述的用于估算汽车质量的有效数据的筛选方法,其特征在于,汽车行驶方程式为:其中,m为汽车质量,Ttq为发动机转矩,ig为变速器传动比,i0为主减速比,η为机械传动效率,r为车轮滚动半径,f为滚动阻力摩擦系数,α为坡度角,CD为风阻系数,A为迎风面积,ua为车速,du/dt为加速度,δ为旋转质量换算系数,g为重力加速度,Ft为汽车行驶的驱动力。5.根据权利要求1或2或3或4所述的用于估算汽车质量的有效数据的筛选方法,其特征在于,所述步骤3)所选取出的特征变量为5个,分别是:速度、发动机扭矩、加速度、传动比、油门开度变化。6.根据权利要求5所述的用于估算汽车质量的有效数据的筛选方法,其特征在于,选取出所述5个特征变量所采用的方法为因子分析法,选取出所述5个特征变量的过程如下:基于汽车行驶方程式中涉及的参数,对汽车质量估算产生影响的因素主要包括:发动机扭矩、燃料消耗率、油门开度、油门开度变化、速度、实际档位、加速度...

【专利技术属性】
技术研发人员:许楠孔岩初亮杨志华王嘉伟
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1