一种基于普适性元规则的交通事故致因挖掘方法技术

技术编号:19277767 阅读:56 留言:0更新日期:2018-10-30 18:11
本发明专利技术公开了一种基于普适性元规则的交通事故致因挖掘方法。该方法通过读入历年交通事故信息,对数据进行预处理后,根据道路交通事故分类标准对每条事故记录进行等级划分,在此基础上运用关联规则分析方法,设置最小支持度、最小置信度和频繁指数的合理阈值,对多数据集进行阈值一致的关联规则挖掘,构建各数据集与强关联规则的二值数据集,进而提取元规则集,再集合元规则集及数据集进行二次挖掘,整合多组数据集中的元规则,得到以元胞模式输出、具有普适特征的多元规则构成的输出规则。本发明专利技术能够挖掘出传统关联规则中的隐藏关联信息,筛选有价值的规则,剔除不具有多片区普适特征的关联规则,为交通安全管理者提供决策辅助。

A mining method of traffic accident causation based on universal meta rule

The invention discloses a traffic accident cause mining method based on universal meta rule. The method reads in the traffic accident information of the past years, preprocesses the data, classifies each accident record according to the classification standard of road traffic accident, and then sets the reasonable threshold of minimum support, minimum confidence and frequent index by using association rule analysis method, and carries out multi-data sets. Mining association rules with consistent thresholds, constructing binary data sets of each data set and strong association rules, then extracting meta-rule sets, then mining meta-rule sets and data sets again, integrating meta-rules in multi-data sets, and obtaining output rules composed of multivariate rules output in cellular mode and with universal characteristics. . The invention can mine the hidden association information in the traditional association rules, screen the valuable rules, eliminate the association rules which do not have the universal characteristics of multi-area, and provide decision-making assistance for traffic safety management.

【技术实现步骤摘要】
一种基于普适性元规则的交通事故致因挖掘方法
本专利技术属于交通安全
,特别涉及了一种基于普适性元规则的交通事故致因挖掘方法。
技术介绍
近年来,城市道路交通快速发展,城市路网规模和路网密度大幅提升,餐饮外送服务、共享单车和共享汽车以及互联网租车行业如雨后春笋般涌现而出,在欣欣向荣的背后,是城市交通面临的沉重压力,交通事故也呈上升趋势。随着当今的交通事故数据记录条件基本完善,如何有效利用此类数据,从大量的交通事故数据中发现症结是现阶段面临的主要问题。通过分析事故发生原因并找出交通事故中各个属性联系的内在规律,为决策层面提供依据,做到有的放矢,通过人为的干预和控制使交通事故发生的条件缺失从而减少交通事故发生的概率。随着人工智能和大数据技术的发展,数据挖掘的理念和方法也开始大量应用于交通领域。关联规则挖掘方法,用于分析数据集中不同事务属性之间的关联性,是目前主流的交通事故数据挖掘手段。关联规则的挖掘算法,也是无监督学习的主要代表之一,正好符合交通事故随机性强和数据分布不均匀的特征,可以使得事务属性之间的潜在关联得以体现,进而对有价值的关联规则进行分析,做出合理决策。现有技术中目前存在本文档来自技高网...

【技术保护点】
1.一种基于普适性元规则的交通事故致因挖掘方法,其特征在于,包括以下步骤:步骤一、数据准备步骤1.1:读取历年交通事故信息,并将其分为事故基本信息、涉事驾驶人信息、事故车辆信息、道路条件信息和环境信息5类交通事故致因信息,且每类交通事故致因信息采用多属性描述;步骤1.2:对读取的交通事故信息进行数据质量分析,筛选保留质量合格的属性变量;步骤1.3:对筛选后的交通事故信息进行属性选择,将与挖掘任务不相关或者冗余的属性剔除,属性选择的目标是找出最小属性集,同时保证数据集的概率分布尽量接近利用所有属性得到的原分布;步骤1.4:对步骤1.3得到的交通事故信息进行数据清洗,包括缺失值处理和噪声过滤;缺失...

【技术特征摘要】
1.一种基于普适性元规则的交通事故致因挖掘方法,其特征在于,包括以下步骤:步骤一、数据准备步骤1.1:读取历年交通事故信息,并将其分为事故基本信息、涉事驾驶人信息、事故车辆信息、道路条件信息和环境信息5类交通事故致因信息,且每类交通事故致因信息采用多属性描述;步骤1.2:对读取的交通事故信息进行数据质量分析,筛选保留质量合格的属性变量;步骤1.3:对筛选后的交通事故信息进行属性选择,将与挖掘任务不相关或者冗余的属性剔除,属性选择的目标是找出最小属性集,同时保证数据集的概率分布尽量接近利用所有属性得到的原分布;步骤1.4:对步骤1.3得到的交通事故信息进行数据清洗,包括缺失值处理和噪声过滤;缺失值处理采用删除法,剔除5类交通事故致因信息中属性缺失度超过预设缺失阈值的信息;噪声过滤采用基于统计学方法的离群点检测算法,诊断出数据中的离群点,并删除;步骤1.5:对连续性分布的属性进行聚类处理,同时,根据道路交通事故分类标准对每条事故进行分类;步骤二、参数选取步骤2.1:根据下列方法计算规则的支持度和置信度:规则在交通数据集T中的支持度如下:其中,规则在交通数据集T中的置信度如下:其中,对于规则X称为规则的前件,Y称为规则的后件,规则R的支持度表示事故致因X和事故致因Y同时发生的概率,规则R的置信度表示在事故致因X发生时,事故致因Y同时发生的条件概率,当规则R的置信度大于预先设置的阈值时,认为X事件的发生诱导了Y事件的发生,置信度越大,说明两者间的联系越紧密;步骤2.2:选择最小支持度S阈值:对不同行政区域交通数据集的不同类别事故进行区分后,根据公式(1)对不同区域的规则进行支持度计算,得到满足最小支持度阈值的关联规则数量和最小支持度阈值的关系图;通过选取不同的最小支持度阈值,以最小支持度阈值为横坐标,以满足最小支持度阈值的关联规则数量为纵坐标,得到各类事故各区域支持度阈值选取趋势图,进行最小支持度阈值选取;步骤2.3:选择最小置信度C阈值:对不同类型下的交通事故数据集,根据公式(1)和(2)对不同区域的规则进行支持度和置信度计算,设置不同的支持度和置信度阈值进行比较分析,得到满足阈值条件的规则分布与阈值设置的气泡关系图,以权衡支持度和置信度阈值的选择范围,其中横坐标对应支持度阈值,纵坐标对应置信度阈值,气泡数量越大,表示包含的关联规则数量越多;步骤2.4:选择频繁指数F阈值:在不同交通数据集之间,筛选普适性元规则的指标为频繁指数,根据不同数据集中分别挖掘得到的关联规则,建立基于多数据集的关联规则频繁指数表,满足频繁指数阈值的关联规则作为普适性元规则,其中,各数据集在挖掘关联规则时采取一致的支持度和置信度阈值,通过布尔变量1和0分别表示存在规则和不存在规则,规则Ri的频繁指数定义如下:其中,pij为规则Ri...

【专利技术属性】
技术研发人员:曾维理赵子瑜李娟任禹蒙孙煜时羊钊
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1