一种基于模糊C均值聚类算法的道路交通状态建模方法技术

技术编号:16188550 阅读:29 留言:0更新日期:2017-09-12 11:35
本发明专利技术公开了一种基于模糊C均值聚类算法的道路交通状态建模方法,属于数据挖掘技术领域。本发明专利技术针对道路交通状态本身具有的模糊性,使用模糊c均值聚类算法对采集的交通数据进行聚类分析。鉴于传统模糊c均值聚类算法在初始化聚类中心时存在盲目性,因此本发明专利技术首先使用Canopy聚类算法来解决该问题,在此基础上又引入了Xie‑Beni指标(XB指标)来自适应确定m的值,从而改善该算法的聚类效果,为后面的道路交通状态识别提供良好的数据处理基础。本发明专利技术在对交通信息进行聚类时具有更好的聚类效果,而且发生误判的概率更小,在此基础上得到的数据挖掘结果更加准确,因此能够更加真实地反映道路交通状态。

A method of road traffic state modeling based on fuzzy C means clustering algorithm

The invention discloses a road traffic state modeling method based on the fuzzy C mean clustering algorithm, belonging to the technical field of data mining. In view of the fuzziness of the road traffic state itself, the fuzzy C mean clustering algorithm is used to cluster the collected traffic data. In view of the traditional fuzzy C means clustering algorithm is blind in the initialization of cluster centers, so the invention firstly uses Canopy clustering algorithm to solve the problem, Xie Beni is introduced on the basis of index (XB index) to determine the value of M, so as to improve the clustering effect of the algorithm, provide a good foundation for data processing for road traffic state recognition behind. The invention has better clustering effect in clustering of traffic information, and the probability of occurrence of smaller misclassification of data mining results based on more accurate, so it can more accurately reflect the road traffic condition.

【技术实现步骤摘要】
一种基于模糊C均值聚类算法的道路交通状态建模方法
本专利技术属于数据挖掘
,涉及一种基于模糊c均值聚类算法的道路交通状态建模方法。
技术介绍
目前,随着经济的快速发展,人们的生活也发生了翻天覆地的变化,尤其是在外出交通方式方面,私家车已成为最主要的交通工具之一,因此汽车数量迅猛增长。到2015年底,中国机动车的保有量已经有2.79亿辆,其中汽车保有量1.72亿辆。汽车数量的急剧增长已经引发了严重的交通问题。当前我国城市交通中存在的问题主要体现在以下几个方面:(1)道路交通拥堵严重,已经严重影响了经济的发展,同时也对环境造成了污染;(2)交通管理落后,在发生交通事件时,信息采集与决策的缓慢以及信息发布不到位,导致不能及时进行救援;(3)停车信息少,停车难等问题,在有限的空间内如何解决好停车问题对于维持好城市交通和谐、优化交通结构和帮助市民出行有很大的帮助。如何解决交通问题早已引起人们的热切关注,因此现在国内都在积极研究智能交通、车联网等技术,努力打造智慧城市。智能交通系统(IntelligentTransportationSystem,简称ITS)是解决当前拥堵问题的有效途径,也是交通事业中的历史性转择点。智能交通系统是现在一种新的交通系统发展模式,它以互联网、车联网等技术为基础,让人们在交通运输上更加智能、高效、安全和完善。车联网是指通过无线射频识别(RadioFrequencyIdentification,RFID)技术、GPS(GlobalPositioningSystem,全球定位系统)定位技术以及各种传感器设备,来进行道路及车辆相关信息的采集;然后通过各种通信网络,在车与车、车与人、车与道路基础设施之间进行信息共享;之后将采集到的信息传递到信息处理中心进行处理,根据不同的需求进行不同的分析,从而实现人、车以及路的协同合作。随着交通数据采集技术的迅速发展,每天都会产生海量的数据,因此产生了车联网大数据现象。面对海量的数据,需要使用数据挖掘技术来发掘潜藏的信息,以便用于道路交通状态的识别,为出行者提供实时的路况信息,以达到缓解交通问题的目的。综合以上信息可知,要想获取准确的路况信息,最重要的一步就是要做好数据挖掘。现在已经有很多数据挖掘算法被用来对交通状态进行挖掘,其中以聚类算法使用的最为普遍。道路交通状态本身具有模糊性,因此一般会使用模糊算法对其进行研究。而模糊c均值聚类算法在对数据进行聚类分析时,与其它方法相比有更高的稳定性和精确性。但是模糊c均值聚类算法自身存在一个缺点,就是在选择初始聚类质心的时候存在一定的盲目性。如何解决选择初始聚类质心的盲目性,以实现更高的稳定性和精确性是一个需要解决的技术问题。
技术实现思路
本专利技术目的在于解决上述现有的技术问题,提出了一种基于模糊c均值聚类算法的道路交通状态识别建模方法,该方法首先使用Canopy算法来初始化聚类中心与聚类数量,而且使用XB指标确定模糊加权指数m;然后计算每个聚类集群内的车辆平均行驶速度;最后根据道路交通状态分类及评价标准来判断每个集群内的交通状态,从而判断整个路段内的交通状态。为实现上述目的,本专利技术提出的技术方案是一种基于模糊C均值聚类算法的道路交通状态建模方法,该方法包括如下步骤:步骤1:定义模糊加权指数为m,迭代终止条件为ε,而且将常数k和迭代次数r设置为0;步骤2:根据Canopy聚类算法获得初始的聚类中心V(0)及聚类数量c;步骤3:计算隶属度矩阵U(r);步骤4:更新聚类中心V(r+1);步骤5:计算||V(r+1)-V(r)||的值,如果||V(r+1)-V(r)||≤ε,那么输出隶属度矩阵U和聚类中心V,否则,设置r=r+1,并且返回第3步;步骤6:计算vXBk的值,如果vXBk≥vXBk-1,则终止算法,同时输出隶属度矩阵Uk-1和聚类中心Vk-1,否则,将k加1,分别选择新的聚类数量c与模糊加权指数为mk,返回第1步;步骤7:通过改进的模糊c均值聚类算法获取每个集群后,计算每个集群区域内的平均速度,然后根据道路交通分类模型与道路交通分类标准来判断道路的交通状况。进一步,上述Canopy聚类算法的具体实现步骤如下:步骤1:将样本数据存放在集合List中,同时设置两个初始距离阈值参数T1与T2,其中T1>T2;步骤2:在List中选择一个样本数据A,然后分别计算其与List中其它样本数据之间的距离d;步骤3:对步骤2中的距离d进行判断,如果d<T1,则将A放入到它所满足要求的集群中,如果d<T2,则将A从List中剔除;步骤4:一直重复步骤2和步骤3,直到集合List为空,算法结束。进一步,上述道路交通分类模型在为基于训练集的J48决策树分类模型,包括以下两个步骤:步骤1:利用二进制流量算法来获取拥堵区域上拥堵长度和判断交通灯的位置;步骤2:通过J48决策树算法对在此之前的分类模型进行更新。上述二进制流量算法首先计算每个集群内的平均速度V0,如果该速度处于交通拥堵状态时的速度阈值范围内,则在拥堵长度L的基础上加上当前集群的长度m,直到所有的集群都完成比较或者是下一个集群内的状态不再是拥堵状态的时候算法结束,最后将获得的拥堵长度L与交通拥堵长度阈值L0进行比较,如果L<L0,则判定当前区域为汽车的临时停靠,否则判定其为拥堵区域。与现有技术相比,本专利技术的有益效果:1、本专利技术在对交通信息进行聚类时具有更好的聚类效果,而且发生误判的概率更小,在此基础上得到的数据挖掘结果更加准确,因此能够更加真实地反映道路交通状态。2、本专利技术为后续研究道路交通状态识别提供了一个良好的数据挖掘算法模型。附图说明图1为本专利技术的方法流程图。具体实施方式下面结合说明书附图对本专利技术创造作进一步的详细说明。本专利技术的应用主要表现在对道路交通状态识别的应用上。有效准确的道路交通状态识别可以帮助交通管理部门做好交通管理工作,同时也可以帮助出行者及时地了解道路交通状态,可以有效缓解现在的交通拥堵问题。现在随着技术的不断进步与汽车数量的增加,每天都会采集到海量的交通数据,从这些数据中可以分析出当前的交通状态,对交通管理和交通问题的解决都能带来很大的帮助。现在已经有很多数据挖掘算法被用来对交通状态进行挖掘,其中以聚类算法使用的最为普遍。很多研究中都使用模糊c均值聚类算法进行聚类分析,该方法与其它方法相比,有更高的稳定性和精确性。但是模糊c均值聚类算法自身存在一个缺点,就是在选择初始聚类质心的时候存在一定的盲目性。因此本专利技术为了解决这个问题,建立了一种基于模糊c均值聚类算法的道路交通状态识别建模模型,该模型首先使用Canopy算法来初始化聚类中心与聚类数量,而且使用XB指标来确定模糊加权指数m。本专利技术的道路交通状态识别建模包括:传统的模糊c均值聚类算法在初始化聚类中心时具有一定的盲目性,因此本专利技术使用Canopy算法来初始化聚类中心。Canopy算法也是一种聚类算法,但是它的优点是针对海量数据可以迅速聚类。该算法不仅能大概得出聚类的数量,而且还能估计出聚类的中心,因此它经常是作为其它聚类算法的预处理步骤,与其它算法结合使用。Canopy聚类算法的具体实现步骤如下:步骤1:将样本数据存放在集合List中,同时设置两个初始距离阈值参数T1与T2本文档来自技高网
...
一种基于模糊C均值聚类算法的道路交通状态建模方法

【技术保护点】
一种基于模糊C均值聚类算法的道路交通状态建模方法,其特征在于,所述方法包括如下步骤:步骤1:定义模糊加权指数为m,迭代终止条件为ε,而且将常数k和迭代次数r设置为0;步骤2:根据Canopy聚类算法获得初始的聚类中心V

【技术特征摘要】
1.一种基于模糊C均值聚类算法的道路交通状态建模方法,其特征在于,所述方法包括如下步骤:步骤1:定义模糊加权指数为m,迭代终止条件为ε,而且将常数k和迭代次数r设置为0;步骤2:根据Canopy聚类算法获得初始的聚类中心V(0)及聚类数量c;步骤3:计算隶属度矩阵U(r);步骤4:更新聚类中心V(r+1);步骤5:计算||V(r+1)-V(r)||的值,如果||V(r+1)-V(r)||≤ε,那么输出隶属度矩阵U和聚类中心V,否则,设置r=r+1,并且返回第3步;步骤6:计算vXBk的值,如果vXBk≥vXBk-1,则终止算法,同时输出隶属度矩阵Uk-1和聚类中心Vk-1,否则,将k加1,分别选择新的聚类数量c与模糊加权指数为mk,返回第1步;步骤7:通过改进的模糊c均值聚类算法获取每个集群后,计算每个集群区域内的平均速度,然后根据道路交通分类模型与道路交通分类标准来判断道路的交通状况。2.根据权利要求1所述的基于模糊C均值聚类算法的道路交通状态建模方法,其特征在于,所述Canopy聚类算法的具体实现步骤如下:步骤1:将样本数据存放在集合List中,同时设置两个初始距离阈值参数T1与T2,其中T1...

【专利技术属性】
技术研发人员:黄波王青杰李大鹏李选张亚茹
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1