基于关联规则的道路交通事故数据挖掘方法及装置制造方法及图纸

技术编号:4252371 阅读:265 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了一种基于关联规则的道路交通事故数据挖掘方法及装置,涉及通信领域。为了能够实现与事故发生的条件因素相关的有效分析和统计,为交通事故的预防、处理和决策等工作服务,本发明专利技术提供的技术方案如下:从道路交通事故的历史数据中获取规定时间范围和规定路段范围的历史数据,作为关联规则挖掘数据;确定所述关联规则挖掘数据的交通事故属性;根据所述关联规则挖掘数据,所述交通事故属性和最小支持度,获取频繁项集;根据所述频繁项集和最小置信度,获取事故关联规则。本发明专利技术适用于实时动态交通信息服务。

【技术实现步骤摘要】

本专利技术涉及通信领域,尤其涉及一种基于关联规则的道路交通事故数据挖掘方法及装置
技术介绍
智能交通系统是目前能全面有效地解决交通运输领域问题,特别是交通拥挤、交 通阻塞、交通事故和交通污染等问题的最佳途径。其中,交通事件(包括事故,交通管制等) 对交通流及路况的影响是智能交通系统的热点研究方向之一, 在当前,我国的道路交通状况存在着道路等级低、交通混行严重、行人干扰大、高 速公路刚刚起步等特点。因此,需要合理分析交通事故,特别是利用科技手段准确把握交通 事故的特征和趋势,以提高道路的安全设计和有针对性地制定道路交通管理措施,从而减 少道路交通事故的发生。 在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下问题目前无法实 现与事故发生的条件因素相关的有效分析和统计,难以为交通事故的预防、处理和决策等 工作服务。
技术实现思路
本专利技术的实施例提供一种基于关联规则的道路交通事故数据挖掘方法及装置,能 够实现与事故发生的条件因素相关的有效分析和统计,为交通事故的预防、处理和决策等 工作服务。 为达到上述目的,本专利技术的实施例采用如下技术方案 —种基于关联规则的道路交通事故数据挖掘方法,包括 从道路交通事故的历史数据中获取规定时间范围和规定路段范围的历史数据,作 为关联规则挖掘数据; 确定所述关联规则挖掘数据的交通事故属性; 根据所述关联规则挖掘数据,所述交通事故属性和最小支持度,获取频繁项集; 根据所述频繁项集和最小置信度,获取事故关联规则。 —种基于关联规则的道路交通事故数据挖掘装置,包括 数据获取单元,用于从道路交通事故的历史数据中获取规定时间范围和规定路段 范围的历史数据,作为关联规则挖掘数据; 属性确定单元,用于确定所述关联规则挖掘数据的交通事故属性; 项集获取单元,用于根据所述数据获取单元获取的关联规则挖掘数据,所述属性确定单元确定的交通事故属性和最小支持度,获取频繁项集; 规则获取单元,用于根据所述项集获取单元获取的频繁项集和最小置信度,获取 事故关联规则。 本专利技术实施例提供的基于关联规则的道路交通事故数据挖掘方法及装置,通过从道路交通事故的历史数据中获取规定时间范围和规定路段范围的历史数据,作为关联规则 挖掘数据;确定所述关联规则挖掘数据的交通事故属性;并根据所述关联规则挖掘数据, 所述交通事故属性和最小支持度,获取频繁项集;然后,根据所述频繁项集和最小置信度, 获取事故关联规则。因此,实现了与事故发生的条件因素相关的有效分析和统计,进而为交 通事故的预防、处理和决策等工作服务。附图说明 为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用 的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。 图1为本专利技术实施例提供的一种基于关联规则的道路交通事故数据挖掘方法的 流程示意图; 图2为本专利技术实施例提供的一种基于关联规则的道路交通事故数据挖掘装置的 构成示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于 本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本专利技术保护的范围。 为了能够实现与事故发生的条件因素相关的有效分析和统计,为交通事故的预 防、处理和决策等工作服务,本专利技术实施例提供了一种基于关联规则的道路交通事故数据 挖掘方法,如图l所示,包括 101、从道路交通事故的历史数据中获取规定时间范围和规定路段范围的历史数 据,作为关联规则挖掘数据; 例如,预先存储所采集到的道路交通事故的历史数据。从存储的道路交通事故的 历史数据中提取一定时间范围和一定路段范围的数据,将提取的数据作为关联规则挖掘数 据。其中,路段范围可以是整个市区、某个辖区或某一条道路。 102、确定所述关联规则挖掘数据的交通事故属性; 其中,交通事故属性可以是指道路交通事故发生时,驾驶员属性、车辆属性、道路 属性、天气属性、时间属性和事故本身属性的集合。 关联规则挖掘数据的交通事故属性还可以具有概念分层,主要有三层 第一层是驾驶员属性,车辆属性,道路属性,天气属性,时间属性和事故本身属性。 第二层是第一层的细化,例如,驾驶员属性可细化为性别、年龄、驾龄、驾证种类、驾驶人员类型、出行目的等。其他属性的细化方式与驾驶员属性的细化方式相似,在此不再赘述。 第三层是对第二层的更进一步细化,主要是对道路交通事故每一属性维的刻度 (也就是粒度)进行分析。例如,性别属性可细化为男、女、未知。年龄属性可细化为l-6岁,7-9岁,10-12岁,13-15岁,16-20岁,21-25岁,26-30岁,31-35岁,36-40岁,41-45岁,46-50岁,51-55岁,56-60岁,61-65岁,65岁以上。驾龄属性可细化为1年及以下,2年,3年,4年,5年,6-10年,11-15年,16-20年,20年以上。驾照种类属性可细化为正式,学习,临时,正式实习期,正式未年审,农机,军队,武警等。驾驶人员类型可细化为职业驾驶员,非职业驾驶员,非驾驶员等。出行目的属性可细化为上、下班,道路作业,职务出行,运输,其它工作出行,上、下学,社交活动,文娱活动,观光旅游,购物,闲游,其它生活出行等。 103、根据所述关联规则挖掘数据,所述交通事故属性和最小支持度,获取频繁项集; 在本专利技术实施例中,假设A、 B、 C分别代表规则的前提条件,则支持度是指在所有的记录中,A、B、C同时出现的概率。 上述的交通事故属性的数据模型是多维多层的,而进行多维多层的数据挖掘是比较繁琐的,这里对其进行简化。即,在进行关联规则分析前,预先指定该维的哪一个层次参与关联分析,其它层次不参与关联分析,从而将问题简化为单纯的多维数据模型的挖掘。 举例而言,可以在进行事故关联规则分析之前,对事故主要原因选择第三层,其它维都是单层的,通过这样的指定,就可以得到多维单层的交通事故属性数据,便于下面的关联分析。 交通事故属性的数据结构一般使用一颗概念层次树(Conc印t HierarchyTree)来组织。其中,概念层次树是指数据库中各属性值和概念依据抽象程度不同而构成的一个层次结构。 举例而言,在概念层次树的建立过程中,需要选定待分析的交通事故本身与驾驶员、车辆、道路、天气、时间等具体选项信息,然后采用自顶向下的策略,由概念层1开始向下,到较低的更特定的概念层,对每个概念层的频繁项集累加计数,直到不能再找到频繁项集。即是,一旦找到概念层1的所有频繁项集,就开始在第2层找频繁项集,如此下去,找到所有概念层的所有频繁项集。 并且,可以在每一层使用多维Apriori算法发现频繁项集,以发现各个因素之间的联系。其中,Apriori算法是一种基于两阶段频集思想的递推算法。在这里,所有支持度大于最小支持度的项集称为频繁项集。 举例而言,假设通过上述方法得到多维单层的交通事故属性数据,如n维数据库D[D1, D2, ... , Dn],并通过用户输入或系统预先存储获得最小支持度,根据D[Dl本文档来自技高网...

【技术保护点】
一种基于关联规则的道路交通事故数据挖掘方法,其特征在于,包括:从道路交通事故的历史数据中获取规定时间范围和规定路段范围的历史数据,作为关联规则挖掘数据;确定所述关联规则挖掘数据的交通事故属性;根据所述关联规则挖掘数据,所述交通事故属性和最小支持度,获取频繁项集;根据所述频繁项集和最小置信度,获取事故关联规则。

【技术特征摘要】
一种基于关联规则的道路交通事故数据挖掘方法,其特征在于,包括从道路交通事故的历史数据中获取规定时间范围和规定路段范围的历史数据,作为关联规则挖掘数据;确定所述关联规则挖掘数据的交通事故属性;根据所述关联规则挖掘数据,所述交通事故属性和最小支持度,获取频繁项集;根据所述频繁项集和最小置信度,获取事故关联规则。2. 根据权利要求1所述的基于关联规则的道路交通事故数据挖掘方法,其特征在于, 所述确定所述关联规则挖掘数据的交通事故属性包括按照规定层次确定所述关联规则挖掘数据的交通事故属性。3. 根据权利要求1所述的基于关联规则的道路交通事故数据挖掘方法,其特征在于, 所述根据所述关联规则挖掘数据,所述交通事故属性和最小支持度,获取频繁项集包括获取最小支持度和第一用户限制条件;根据所述关联规则挖掘数据,所述交通事故属性,所述最小支持度和所述第一用户限 制条件,获取频繁项集。4. 根据权利要求2或3所述的基于关联规则的道路交通事故数据挖掘方法,其特征在 于,所述根据所述关联规则挖掘数据,所述交通事故属性,所述最小支持度和所述第一用户 限制条件,获取频繁项集包括根据所述关联规则挖掘数据,每一层的交通事故属性,所述最小支持度和所述第一用 户限制条件,获取所述层的频繁项集。5. 根据权利要求1所述的基于关联规则的道路交通事故数据挖掘方法,其特征在于, 所述根据所述频繁项集和最小置信度,获取事故关联规则包括获取最小置信度和第二用户限制条件;根据所述频繁项集,所述最小置信度和所述第二用户限制条件,获取满足所述最小置 信度和所述第二用户限制条件的关联规则; 将获取的关联规则作为事故关联规则。6. 根据权利要求1所述的基于关联规则的道路交通事故数据挖掘方法,其特征在于, 所述道路交通事故属性包括驾驶员属性,车辆属性,道路属性,天气属性,时间属性和事故 本身属性。7. —种基于关联规则的道路交通事故数据挖掘装置,其特征在于,...

【专利技术属性】
技术研发人员:昝艳付新刚贾学力李建军
申请(专利权)人:北京世纪高通科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1