一种多源数据结构下优化交通事故数据的方法技术

技术编号：31484090 阅读：30 留言：0更新日期：2021-12-18 12:18

本发明专利技术公开了一种多源数据结构下优化交通事故数据的方法，包括如下步骤：（1）多源交通数据采集；（2）构建符合多源数据形态分布的生成模型；（3）平衡交通事故数据结构；（4）优化数据的验证与评价。本发明专利技术首先对多源交通事故数据进行采集与汇总，分别确定每一种交通数据类型的分布形态，其次基于数据分布形态构建事故数据生成模型，最后基于道路安全分析模型对优化后的数据集进行验证与评价。本发明专利技术方法能够大幅度减少不平衡交通事故数据结构对安全分析模型的影响，获得准确可靠的交通安全评价结果。果。果。

全部详细技术资料下载

【技术实现步骤摘要】
一种多源数据结构下优化交通事故数据的方法

[0001]本专利技术涉及一种多源数据结构下优化交通事故数据的方法，属于交通数据结构

技术介绍

[0002]近几年构建道路安全事故分析模型成为了交通安全领域的研究热点，然而模型的表现很大程度上依赖于交通事故数据结构的有效性。交通事故作为一种小概率事件，特别是严重性事故，经常会导致事故数据结构不平衡，即事故数据样本远远小于零事故样本(即零过多现象)。目前在科研领域与专利应用领域，大多数的研究都是基于传统的统计分析模型，如零膨胀泊松回归模型、自举重采样等。随着先进的数据挖掘技术发展，上采样与下采样技术开始用于数据结构平衡优化，如合成少数类过采样技术、生成式对抗网络等。
[0003]然而上述方法在生成新的数据集时往往赋予所有变量共同的似然函数，忽略了不同变量之间的异质性，从而影响了模型的拟合效果和安全因素的识别。因此，为保证数据生成的有效性，保证准确可靠的安全评估结果的获取，需要针对不同变量数据分别构建符合各自形态分布的似然函数，生成新的数据集，使得事故数据结构平衡。r/>
技术实现思路
<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多源数据结构下优化交通事故数据的方法，其特征在于，包括如下步骤：步骤1，采集多源交通数据，即获取多源交通安全影响因素数据；步骤2，构建符合多源交通数据形态分布的生成模型，即为步骤1获取的各个影响因素构建分布形态函数；步骤3，基于步骤2构建的生成模型对步骤1采集的多源交通数据进行增生优化处理，使得处理后的多源交通数据中事故样本的数量与零事故样本的数量比例为1:4。2.根据权利要求1所述多源数据结构下优化交通事故数据的方法，其特征在于，所述优化交通事故数据的方法还包括步骤4，构建交通安全分析模型，并根据模型的拟合指标对增生优化结果进行验证。3.根据权利要求1所述多源数据结构下优化交通事故数据的方法，其特征在于，步骤1所述多源交通安全影响因素包括：路段年交通事故总数量N、路段长度L、路段日平均交通量Q、路段平均车速V、路段的交通节点密度S、道路等级A、道路路幅宽度W、道路车道数K以及有无公交车道B。4.根据权利要求3所述多源数据结构下优化交通事故数据的方法，其特征在于，所述步骤2的具体过程如下：将多源交通安全影响因素划分为计数变量、实值变量、分类变量和有序变量；所述计数变量包括路段年交通事故总数量N，构建路段年交通事故总数量的分布形态函数如式(1)：其中，p(N＝G)表示路段产生G起事故的概率，λ表示单位时间或者单位面积内事故发生的平均次数，G为自然数；所述实值变量包括路段长度L、路段日平均交通量Q、路段的交通节点密度S以及道路路幅宽度W，构建实值变量的分布形态函数如式(2)：其中，Z表示实值变量，p(Z＝J)表示实值变量取值J的概率，表示正态分布函数，μ(I)、σ(I)2分别为高斯分布的均值与方差，I表示实值变量的实际观测值；所述分类变量包括道路等级A、道路车道数K以及有无公交车道B，构建分类变量的分布形态函数如式(3)：其中，H表示分类变量，p(...

【专利技术属性】
技术研发人员：郭延永，刘攀，丁红亮，马景峰，李清韵，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人