一种基于北斗位置数据的公路交通安全隐患排查方法技术

技术编号:32642301 阅读:21 留言:0更新日期:2022-03-12 18:18
本发明专利技术公开了一种基于北斗位置数据的公路交通安全隐患排查方法,涉及交通安全技术领域。本发明专利技术包括以下步骤:步骤一:将车辆的北斗位置数据进行预处理;步骤二:根据进行预处理后的数据集,采用bootstrap采方法有放回地重随机抽取样本生成N个训练样本集合,构成N棵决策树组成的决策森林;步骤三:设训练样本集中特征的个数为M,决策树的节点分割时,在M个特征中随机的选择M个特征,然后从M个特征中选择一个最优的特征的进行切分;步骤四:对每棵决策树的节点不断分割,直至该节点的所有训练样本属于同一类。实现了车辆行驶监测系统和驾驶行为分析,从而能够有效的实现对道路交通安全隐患的排查,大大提高了道路交通的安全性。大大提高了道路交通的安全性。大大提高了道路交通的安全性。

【技术实现步骤摘要】
一种基于北斗位置数据的公路交通安全隐患排查方法


[0001]本专利技术属于交通安全
,特别是涉及一种基于北斗位置数据的公路交通安全隐患排查方法。

技术介绍

[0002]近年来,汽车已经成为我们日常出行必不可少的交通工具。随着汽车保有量的不断增加,对车辆的定位监管也成为当下的一个趋势。
[0003]汽车的专利技术不仅给人们的出行带来了巨大的方便,更使得交通运输行业蓬勃发展。但是由于车辆众多,再加上驾驶员并不能保证每时每刻都能规范驾驶。汽车数量的增长所带来的交通事故隐患不容乐观,而绝大多数交通事故产生的原因与驾驶员的不良驾驶行为密切相关。正确高效地监测车辆、及时发现驾驶员的不良驾驶行为、规范驾驶员的驾驶行为习惯,则显得尤为重要。有效的管理运输车辆、监测车辆动态、规范驾驶员的驾驶行为、确保车辆安全出行,已经成为交通运输切解决的问题之一。因此本文提出一种基于北斗位置数据的公路交通安全隐患排查方法。

技术实现思路

[0004]本专利技术的目的在于提供一种基于北斗位置数据的公路交通安全隐患排查方法,解决了上述技术背景中的问题。
[0005]为解决上述技术问题,本专利技术是通过以下技术方案实现的:
[0006]本专利技术为一种基于北斗位置数据的公路交通安全隐患排查方法,包括以下步骤:
[0007]步骤一:将车辆的北斗位置数据进行预处理;
[0008]步骤二:根据进行预处理后的数据集,采用bootstrap采方法有放回地重随机抽取样本生成N个训练样本集合,构成N棵决策树组成的决策森林;
[0009]步骤三:设训练样本集中特征的个数为M,决策树的节点分割时,在M个特征中随机的选择M个特征,然后从M个特征中选择一个最优的特征的进行切分;
[0010]步骤四:对每棵决策树的节点不断分割,直至该节点的所有训练样本属于同一类;
[0011]步骤五:收集每一棵决策树的分类结果,随机森林选取分类最多的类别作为最终的结果。
[0012]优选的,所述步骤三中,决策树的构建方法为:
[0013]设D是训练样本集,类别属性具有M个不同的值,则有M个不同类C(i=1,2,

,m),D
i
是C
i
的样本集合,则信息熵的计算公式包括:其中P
i
是结合D中任意属于C
i
的概率,用表示;
[0014]S设训练样本集D按属性A进行划分,则条件熵为:其
中,D
i
表示属性A划分样本集的个数,则属性A的信息增益函数为:Gain(A)=Info(D)

Info
A
(D)。
[0015]优选的,决策树的构建中,通过增益率的信息增益率扩充来克服其中偏心多值属性的缺陷,其中分裂信息的公式为:增益率为:
[0016]优选的,所述步骤二中,设训练样本集为D,属性为A,决策树的构造流程包括以下步骤:
[0017]S1:创建节点N;
[0018]S2:若D都在同一个类C中,则返回N作为叶节点,用类C标记;
[0019]S3:若A为空,则返回N作为叶节点,标记D为样本树种最多的类;
[0020]S4:若是通过增益率选取最佳属性,则将a0标记为N,并在属性集中去掉a0;
[0021]S5:N根据a0的值划分成不同的子集D
s
,若D
s
为空,则将N标记为叶节点,标记D为样本树种最多的类;若D
s
不为空,在子集D
s
和剔除了a0的新的属性集A
a0
中再选出最佳属性a1,标记为新的节点N,并在属性集中剔除a1;
[0022]S6:重复执行以上步骤n次,生成n棵决策树,形成随机森林,经过每棵决策树对测试数据的决策投票,分析判断最终得出决策分类结果。
[0023]优选的,所述步骤一中:车辆的北斗位置数据包括车辆的行驶速度,行驶方向,经纬度,地理位置和定位时间。
[0024]优选的,所述步骤四中,对每棵决策树的节点不断分割分类结果为,特征权重,决策树数目,数据分离比和交叉验证。
[0025]优选的,所述交叉验证包括以下步骤:
[0026]S1:采用随机采样的方法,且不重复地将原始数据分为5组;
[0027]S2:选取其中的1组作为测试集,剩下的作为训练集;
[0028]S3:重复所述S2五次选取,每次选取的数据具有相同的几率成为测试集或训练集;
[0029]S4:在每个训练集上进行训练并得到一个模型,然后通过与得到模型对应的测试集进行测试,计算并保存参数和模型评估指标;
[0030]S5:取5组验证结果的平均值,作为精度的估计和性能指标。
[0031]本专利技术具有以下有益效果:
[0032]本专利技术通过对车辆的北斗位置数据预处理统计形成散列数据,使用随机森林对数据构建模型进行分析,从而决策出未知数据的分类类别,实现了车辆行驶监测系统和驾驶行为分析,从而能够有效的实现对道路交通安全隐患的排查,大大提高了道路交通的安全性。
[0033]当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
[0034]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领
域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1为一种基于北斗位置数据的公路交通安全隐患排查方法的结构示意图;
[0036]图2为本专利技术决策树数目与模型精度的关系图。
具体实施方式
[0037]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0038]请参阅图1,本专利技术为一种基于北斗位置数据的公路交通安全隐患排查方法,包括以下步骤:
[0039]步骤一:将车辆的北斗位置数据进行预处理,选取车辆的速度、漂移数据、定位时间,作为管件分析特征,由于原始数据大量且没有任何标记,选取车辆的速度平均值、速度数据中位值、速度最大值、速度0值次数和超速次数进行预处理,并储存,进行模型训练和评估。
[0040]步骤二:根据进行预处理后的数据集,采用bootstrap采方法有放回地重随机抽取样本生成N个训练样本集合,构成N棵决策树组成的决策森林。
[0041]步骤三:设训练样本集中特征的个数为M,决策树的节点分割时,在M个特征中随机的选择M个特征,然后从M个特征中选择一个最优的特征的进行切分。
[0042]步骤四:对每棵决策树的节点不断分割,直至该节点的所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于:包括以下步骤:步骤一:将车辆的北斗位置数据进行预处理;步骤二:根据进行预处理后的数据集,采用bootstrap采方法有放回地重随机抽取样本生成N个训练样本集合,构成N棵决策树组成的决策森林;步骤三:设训练样本集中特征的个数为M,决策树的节点分割时,在M个特征中随机的选择M个特征,然后从M个特征中选择一个最优的特征的进行切分;步骤四:对每棵决策树的节点不断分割,直至该节点的所有训练样本属于同一类;步骤五:收集每一棵决策树的分类结果,随机森林选取分类最多的类别作为最终的结果。2.根据权利要求1所述的一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于,所述步骤三中,决策树的构建方法为:设D为训练样本集,类别属性具有M个不同的值,则有M个不同类C(i=1,2,

,m),D
i
是C
i
的样本集合,则信息熵的计算公式包括:其中P
i
是结合D中任意属于C
i
的概率,用表示;S设训练样本集D按属性A进行划分,则条件熵为:其中,D
i
表示属性A划分样本集的个数,则属性A的信息增益函数为:Gain(A)=Info(D)

Info
A
(D)。3.根据权利要求2所述的一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于,决策树的构建中,通过增益率的信息增益率扩充来克服其中偏心多值属性的缺陷,其中分裂信息的公式为:增益率为:4.根据权利要求1所述的一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于,所述步骤二中,设训练样本集为D,属性为A,决策树的构造流程包...

【专利技术属性】
技术研发人员:祝凯陶仁友胡新磊邹云超阮康许咪丁建国
申请(专利权)人:安徽庐峰交通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1