一种基于知识图谱的交通事故分析与防控方法及系统技术方案

技术编号:28295639 阅读:49 留言:0更新日期:2021-04-30 16:19
一种基于知识图谱的交通事故分析与防控方法,其具体步骤如下:S1.提取交通事故数据,构建交通事故知识图谱G;S2.训练GraphSAGE模型,对交通事故知识图谱G中的事故实体进行表示学习,然后进行聚类分析,移除偶发的交通事故;S3.训练多分类任务的全连接深度神经网络,利用事故的向量表示,对其对应的标签进行预测;S4.利用向量表示空间的欧式距离,生成特定标签事故主要成因表。本发明专利技术基于交通事故知识图谱,使用GraphSAGE模型对交通事件进行表示学习,随后进行聚类分析,并删除交通事故随机噪声。然后使用多分类任务的全连接深度神经网络,利用事故的向量表示对事故标签进行预测。同时生成特定标签事故主要成因表,用以支持下游的事故预警以及防控等具体工作。

【技术实现步骤摘要】
一种基于知识图谱的交通事故分析与防控方法及系统
本专利技术属于智能交通工程领域,涉及一种基于知识图谱的交通事故分析与防控方法及系统。
技术介绍
随着城市人口与城市人均汽车保有量的增长,城市交通事故也变得日益频发。交通事故包含了多种环境特征(天气状态,能见度,路口的车道数,事故发生的时段等)。传统的交通事故分析方法往往基于报表方式,试图对交通事故进行统计学上的分析。很难从深层次的交通事故特征中挖掘事故成因(比如,针对给定的天气状况,能见度,车流量等信息,在某个具备某些特征的路口,有可能发生哪些类型的事故,而其中最可能的是哪几类)。近年来,随着非结构化数据的海量涌现,知识图谱技术经历了高速发展。该技术在融合多源异构数据与挖掘数据隐含关联方面取得了长足进步。因此知识图谱技术在交通事故分析领域也有进一步应用的空间与价值。
技术实现思路
针对上述
技术介绍
介绍中存在的问题,本专利技术的目的在于提供了一种有更好预测与分析能力并对交通事故防控方面的应用做出贡献的基于知识图谱的交通事故分析与防控方法及系统,基于交通事故知识图谱,首先使对交通事件进行表示学习,。然后使用多分类任务的全连接深度神经网络,利用事故的向量表示对事故标签进行预测。同时生成特定标签事故主要成因表,用以支持下游的事故预警以及防控等具体工作。本专利技术采用的技术方案是:一种基于知识图谱的交通事故分析与防控方法,其具体步骤如下:S1.提取交通事故数据,构建交通事故知识图谱G;S2.对交通事故知识图谱G中的实体进行表示学习,生成实体的向量表示;S3.基于已训练的多分类任务的全连接深度神经网络,利用交通事故的向量表示,对其对应的交通事故标签进行预测;S4.利用向量表示空间,生成交通事故标签事故主要成因,所述事故主要成因为交通事故知识图谱G中与交通事故标签相关的实体。进一步,步骤S2还包括步骤:利用事故的向量表示进行聚类分析,移除偶发的交通事故。进一步,步骤S1中的交通事故知识图谱G的构建步骤包括:S1.1提取交通事故的原始多维特征,至少包括交通事故环境特征和交通事故事件特征;S1.2将交通事故的原始多维特征转化为数值特征,获得交通事故环境特征X1、X2、…、Xk、…、XK,Xk表示第k个环境特征,K表示环境特征个数,x_X1表示环境特征X1的值,N_X1表示环境特征X1的取值个数,交通事故事件特征:Y1、Y2、…、Ym、…、YM,Ym表示第m个事件特征,M表示事件特征个数,y_Y1表示事件特征Y1的值,N_Y1表示环境特征Y1的取值个数;S1.3根据交通事故事件特征,提取交通事故标签Y;交通事故标签Y=g(Y1,Y2,…,Ym,…,YM),g()表示事故标签提取函数;S1.4提取实例实体,关系,概念实体,生成交通事故知识图谱G,其中实例实体指交通事故特征对应的某一具体物体、事件;概念实体指交通事故特征对应的具体值;关系指实例实体和概念实体的关系以及实例实体和实例实体的关系。进一步,步骤S2的具体步骤包括:S2.1.训练GraphSAGE模型对交通事故知识图谱G中的实体进行表示学习,生成实体的向量表示;S2.2.利用K-Means算法对交通事故知识图谱G中的交通事故实体进行聚类;S2.3.将与聚类中心距离超出阈值的交通事故实体认为是偶发的交通事故,并且从知识图谱G中移除。进一步,步骤S2.1中表示学习的具体过程如下:记交通事故知识图谱G中所有的实体的集合为V,且对于每一个实体,假设其已经具备初始的向量表示那么GraphSAGE输出结果zv的过程如下:其中,公式(1)(2)(3)为GraphSAGE第1层神经网络的计算过程,而公式(4)(5)(6)为GraphSAGE第2层神经网络的计算过程;N(v)是一个集合,表示的是实体v所邻接的所有实体;AGG1和AGG2是第1层与第2层的聚合函数;公式(1)表示:对一个实体v的每一个邻居u,取这些邻居的向量表示然后对它们做平均池化操作,得到此外,表示的是向量的模长,CONCAT表示向量的拼接操作;最后W1和W2分别为每一层的权重矩阵,而函数σ(·)是逻辑函数;训练GraphSAGE模型时的损失函数:其中,J(v)表示的是对实体v的损失函数,T表示的是矩阵转置操作,u表示的是从v的邻居中随机采样得到得一个实体,x表示的是距离v的hop距离hop>hop_limit的被随机获取的实体,hop距离为两个实体之间经过的关系最小个数,Q为负例样本采样次数。进一步,步骤S2.2中K-Means算法的聚类过程如下:基于预先给定的超参数k,K-Means算法的目的是生成一系列的簇C={C1,C2,…,Ck},使得每一个交通实体a属于其中的一个簇;K-Means算法优化目标是最小化平方差E:其中dist(·)为欧式空间的距离,而μi代表的是簇Ci的中心;为了获得每一个簇,K-Means算法的运算步骤如下:步骤(0):指定簇的个数k,指定最大迭代次数N,将所有的交通事故向量表示a的集合记为样本A,当前迭代次数M设为0;步骤(1):从A中随机选择k个样本作为初始的k个簇的中心{μ1,μ2,...,μk};步骤(2):M加1,如果M>N则进入步骤(3);如果M≤N,那么:步骤(2.1):将簇划分C初始化为步骤(2.2):对每一个交通事故样本ai,计算其和各个簇中心{μ1,μ2,...,μk}的距离dij=dist(ai,μj),然后将ai归入最小的dij所对应的类别λi,然后更新步骤(2.3):对于j=1,2,…,k,利用簇Cj包含的样本点重新计算其中心步骤(2.4):如果每个簇的中心都没有发生变化,则进入步骤(3);否则进入步骤(2);步骤(3):输出簇分类结果C={C1,C2,C3,…,Ck}。进一步,步骤S2.3的过程如下:在K-Means算法计算完毕以后,获得了k个簇,预设距离阈值超参数t,那么初始化集合N;针对每一个簇Ci:针对Ci中的每一个交通事件向量表示a,计算其与簇中心μi的距离d。如果d>t,则更新N:N=N∪{a}将集合N中包含的向量所对应的交通事故实体从交通事故知识图谱G中移除;假设在移除之前,所有的交通事故向量表示的集合为A;在移除之后,将剩余的交通事故向量表示的集合记为Aclean:Aclean=A-N。进一步,步骤S3中所述多分类任务的全连接深度神经网络的训练过程的具体步骤包括:利用知识图谱G中样本训练一个用于多分类任务的深度全连接神经网络模型;所述深度全连接神经网络模型包括1个输入层,至少1个隐藏层,1个输出层;模型输出结果是一个R维度的概率向量y,向量y中的每一个维度i的取值本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的交通事故分析与防控方法,其具体步骤如下:/nS1.提取交通事故数据,构建交通事故知识图谱G;/nS2.对交通事故知识图谱G中的实体进行表示学习,生成实体的向量表示;/nS3.基于已训练的多分类任务的全连接深度神经网络,利用交通事故的向量表示,对其对应的交通事故标签进行预测;/nS4.利用向量表示空间,生成交通事故标签事故主要成因,所述事故主要成因为交通事故知识图谱G中与交通事故标签相关的实体。/n

【技术特征摘要】
1.一种基于知识图谱的交通事故分析与防控方法,其具体步骤如下:
S1.提取交通事故数据,构建交通事故知识图谱G;
S2.对交通事故知识图谱G中的实体进行表示学习,生成实体的向量表示;
S3.基于已训练的多分类任务的全连接深度神经网络,利用交通事故的向量表示,对其对应的交通事故标签进行预测;
S4.利用向量表示空间,生成交通事故标签事故主要成因,所述事故主要成因为交通事故知识图谱G中与交通事故标签相关的实体。


2.根据权利要求1所述的一种基于知识图谱的交通事故分析与防控方法,其特征在于:步骤S2还包括步骤:利用事故的向量表示进行聚类分析,移除偶发的交通事故。


3.根据权利要求1或2所述的一种基于知识图谱的交通事故分析与防控方法,其特征在于:步骤S1中的交通事故知识图谱G的构建步骤包括:
S1.1提取交通事故的原始多维特征,至少包括交通事故环境特征和交通事故事件特征;
S1.2将交通事故的原始多维特征转化为数值特征,获得交通事故环境特征X1、X2、…、Xk、…、XK,Xk表示第k个环境特征,K表示环境特征个数,x_X1表示环境特征X1的值,N_X1表示环境特征X1的取值个数,交通事故事件特征:Y1、Y2、…、Ym、…、YM,Ym表示第m个事件特征,M表示事件特征个数,y_Y1表示事件特征Y1的值,N_Y1表示环境特征Y1的取值个数;
S1.3根据交通事故事件特征,提取交通事故标签Y;
交通事故标签Y=g(Y1,Y2,…,Ym,…,YM),g()表示事故标签提取函数;
S1.4提取实例实体,关系,概念实体,生成交通事故知识图谱G,其中实例实体指交通事故特征对应的某一具体物体、事件;概念实体指交通事故特征对应的具体值;关系指实例实体和概念实体的关系以及实例实体和实例实体的关系。


4.根据权利要求1或2所述的一种基于知识图谱的交通事故分析与防控方法,其特征在于:步骤S2的具体步骤包括:
S2.1.训练TransE模型或GraphSAGE模型对交通事故知识图谱G中的实体进行表示学习,生成实体的向量表示;
S2.2.利用K-Means算法或k-medoids算法对交通事故知识图谱G中的交通事故实体进行聚类;
S2.3.将与聚类中心距离超出距离阈值的交通事故实体认为是偶发的交通事故,并且从交通事故知识图谱G中移除。


5.根据权利要求4所述的一种基于知识图谱的交通事故分析与防控方法,其特征在于:步骤S2.1中采用GraphSAGE模型进行表示学习的具体过程如下:
记交通事故知识图谱G中所有的实体的集合为V,且对于每一个实体v∈V,假设其已经具备初始的向量表示那么GraphSAGE输出结果zv的过程如下:





















其中,公式(1)(2)(3)为GraphSAGE第1层神经网络的计算过程,而公式(4)(5)(6)为GraphSAGE第2层神经网络的计算过程;N(v)是一个集合,表示的是实体v所邻接的所有实体;AGG1和AGG2是第1层与第2层的聚合函数;公式(1)表示:对一个实体v的每一个邻居u,取这些邻居的向量表示然后对它们做平均池化操作,得到此外,表示的是向量的模长,CONCAT表示向量的拼接操作;最后W1和W2分别为每一层的权重矩阵,而函数σ(·)是逻辑函数;
训练GraphSAGE模型时的损失函数:






其中,J(v)表示的是对实体v的损失函数,表示的是矩阵转置操作,u表示的是从v的邻居中随机采样得到得一个实体,x表示的是距离v的hop距离hop>hop_limit的被随机获取的实体,hop距离为两个实体之间经过的关系最小个数,Q为负例样本采样次数。


6.根据权利要求4所述的一种基于知识图谱的交通事故分析与防控方法,其特征在于:步骤S2.2中采用K-Means算法的聚类过程如下:
基于预先给定的超参数k,K-Means算法的目的是生成一系列的簇C={C1,C2,...,Ck},使得每一个交通实体a属于其中的一个簇;K-Means算法优化目标是最小化平方差E:






其中dist(·)为欧式空间的距离,而μi代...

【专利技术属性】
技术研发人员:季青原吴建平徐甲吴越聂文涛陈乾林文霞吴占宁温晓岳
申请(专利权)人:银江股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1