一种可排除错误信息的多模型不确定再现结果分析方法技术

技术编号:23513280 阅读:23 留言:0更新日期:2020-03-18 00:24
针对分析多模型不确定再现结果时大多需要专家意见且未分析结果中可能包含错误信息的现状,本发明专利技术提出一种可排除错误信息的多模型不确定再现结果分析方法。其先根据再现结果所服从分布情况对结果进行离散化处理,形成样本集M,并对M中的样本进行聚类;接着统计各样本到所属聚类中心的距离,形成样本集P,根据P的上、下界设置距离阀值d后,将P中距离大于d的样本剔除得样本集N;最后统计N中样本点落在各聚类区间的频数并将其视为各聚类区间的概率,进而输出聚类区间及对应概率值作为最终结果。与现有技术相比,本发明专利技术技术方案的有益效果是:无需专家意见便能将不确定结果中错误信息剔除,并将多模型不确定再现结果融合后作为一个结果输出。

An analysis method of multiple model uncertainty reproduction results that can eliminate error information

【技术实现步骤摘要】
一种可排除错误信息的多模型不确定再现结果分析方法
本专利技术涉及事故再现领域,更具体地,涉及一种可排除错误信息的多模型不确定再现结果分析方法。
技术介绍
无论从死伤人数还是社会关注度来看,我国交通安全形式依然很严峻。为此需继续加强对交通事故的研究,以从中获得智慧,改善交通安全。交通事故再现是研究事故的重要手段。事故再现指依据事故现场遗留的各类痕迹并参考证人证言推算碰撞发生位置及碰撞速度等参数、进而重建整个事故过程中各事故参与者的动力学与运动学响应过程。事故再现的基础是遗留在事故现场的各类痕迹,受过往行人、车辆及天气等因素影响这些痕迹会慢慢消逝或破坏而导致其测量不准甚至测量不到,由此使得不确定痕迹的产生。为获得高可信的事故再现结果,人们提出了诸多的基于人体抛距、车辆制动距离、车体变形、人体损伤、车载安全设施数据、视频监控及基于仿真的系列事故再现方法,同时提出了系列的计算不确定性分析方法将痕迹的不确定性反映到事故再现结果中去。这些研究成果导致如今人们可以轻松地选择超过一种以上的事故再现方法再现同一事故且可轻松获得其不确定事故再现结果,由此产生了不同方法所得多个不确定结果如何融合的问题。已有研究基于证据或决策理论,结合专家意见就区间结果融合的问题给出了解决方案,但这些结果的最大缺陷在于专家意见的获得,同时所提出的方法并未就结果中包含的不确定信息作更深入的讨论。这些不确定信息一些是因痕迹消逝而导致的客观不确定信息,另一些则是人为疏忽而导致的错误信息。为使最终融合结果值得信赖,在对结果进行融合前,显然需将错误的信息排除。因此我们需要一种方法,使其既能分析不确定区间结果、也能分析不确定概率结果、还能在融合结果前将结果中包含的可能错误信息剔除、且在整个过程中无需专家意见的支持。纵观既有研究,鲜见类似成果。
技术实现思路
针对现有研究成果在分析多模型不确定再现结果时大多需要专家意见且未分析结果中可能包含错误信息的现状,本专利技术提出一种可排除错误信息的多模型不确定再现结果分析方法,实施步骤如下:S1:根据事故再现结果所服从的分布情况将结果离散化,得样本集M;S2:对M中样本进行聚类;S3:统计各样本到所属聚类中心的距离,形成样本集P;S4:根据P的上界设置距离阀值d;S5:将P中距离大于d的样本剔除,得到样本集N;S6:统计N中样本点落在各聚类区间的频数并将其视为各个聚类区间的概率,进而输出聚类区间及对应概率值作为最终结果。当某一事故案例选择多个模型对其进行再现、并获得多个不确定再现结果时,首先根据再现结果所服从的分布情况对结果进行离散化处理;然后将离散化数据组合成样本集M,并对M中的样本进行聚类;接着统计各样本到所属聚类中心的距离,形成样本集P,根据P的上、下界设置距离阀值d后,将P中距离大于d的样本剔除得样本集N;最后统计N中样本点落在各聚类区间的频数并将其视为各聚类区间的概率,进而输出聚类区间及对应概率值作为最终结果。优选地,步骤S1中不确定事故再现结果包括区间结果、概率结果,区间结果视为服从均匀分布的概率结果。优选地,步骤S1中对结果进行离散化为在结果区间内根据其概率信息生成随机数,随机数的个数为n,为保证结果的稳定性,n不应少于107。优选地,步骤S1中样本集M由所有离散化结果组成。对于一个具有m个不确定结果且每个结果生成有n个随机数的问题,M的样本数应为m×n个。优选地,步骤S2对M中样本进行聚类的步骤如下:S21:根据实际需求设置聚类数k;S22:随机分配k个数据成为初始聚类中心;S23:为每一个数据找到最近的聚类中心;S24:对于k个聚类中的每一个类,找到聚类中心,并将聚类中心进行更新;S25:重复步骤S23~S25,直到收敛;S26:输出聚类结果。优选地,步骤S4中距离阀值d由下式计算获得:d=0.95dupper式中,dupper为P的上界。优选地,步骤S6中的聚类区间由各聚类中样本的上下界组成,并以区间数的形式给出,如{…,[a,b],…}。优选地,步骤S6中聚类区间的概率p由下式计算获得:式中,Ki为聚类i中所有样本数,t为S5中样本集N的数量。优选地,步骤S6中将各聚类结果区间与其所对应的概率组合成一个向量,并通过形式{…,[a,b]p,…}作为最终融合结果输出,其中[a,b]为任意的聚类结果区间,p为与之对应的概率。与现有技术相比,本专利技术技术方案的有益效果是:无需专家意见便能将不确定结果中错误信息剔除,并将多模型不确定再现结果融合后作为一个结果输出。附图说明图1为本专利技术的方法流程图。具体实施方式附图仅用于示例性说明,不能理解为对本专利的限制;下面结合附图和实施例对本专利技术的技术方案做进一步的说明。实施例1对于一起真实车人碰撞事故,采用4种方法对其再现获得4个不确定区间结果,分别为{[64,66],[63,65],[59,69],[65,75]}km/h。通过如下步骤对这4个不确定结果进行分析与融合:S1:依据每一个事故再现结果所服从的分布情况生成n个随机数,取n=107。本案例的事故再现结果为区间结果,故将其视为服从均匀分布的概率结果,并将所生成的4×107个随机数组合成一个新的样本集M。S2:对M中样本进行聚类,聚类方法采用K-Means聚类算法,具体步骤如下:S21:根据实际需求设置聚类数k=4;S22:随机分配4个数据成为初始聚类中心;S23:为每一个数据找到最近的聚类中心;S24:对于4个聚类中的每一个类,找到聚类中心,并将聚类中心进行更新;S25:重复步骤S23~S24,直到收敛;S3:统计各样本到所属聚类中心的距离,形成样本集P;S4:根据P的上界设置距离阀值d,经过统计,该案例中P的上界为2.314,则距离阀值d=1.908;S5:将P中距离大于d的样本剔除,得到样本集N,同时对各聚类中的样本进行统计,得到各聚类中的上下界,即聚类结果区间为:{[60.86,62.71],[62.71,66.32],[66.32,69.98],[70.79,74.61]};S6:统计N中样本点落在各聚类区间的频数,并用下式计算出各个聚类区间的概率,式中,Ki为聚类i中所有样本数,t为S5中样本集N的数量;将聚类结果区间与其对应的概率组合成一个向量,并通过形式{…,[a,b]p,…}作为最终融合结果输出,得到的最终结果为:{[60.86,62.71]0.0956,[62.71,66.32]0.6429,[66.32,69.98]0.1631,[70.79,74.61]0.0984}。本专利技术提出了一种可排除错误信息的多模型不确定再现结果分析方法,通过该方法,不需要任何专家意见就能将不确定结果中错误信息剔除、并将多模型不确定再现本文档来自技高网
...

【技术保护点】
1.一种可排除错误信息的多模型不确定再现结果分析方法,其特征在于:无需专家意见就能将事故再现区间结果、概率结果、区间/概率混合结果中错误的信息剔除,并给出最终融合结果,具体实施步骤如下:/nS1:根据事故再现结果所服从的分布情况将结果离散化,得样本集M;/nS2:对M中样本进行聚类;/nS3:统计各样本到所属聚类中心的距离,形成样本集P;/nS4:根据P的上界设置距离阀值d;/nS5:将P中距离大于d的样本剔除,得到样本集N;/nS6:统计N中样本点落在各聚类区间的频数并将其视为各个聚类区间的概率,进而输出聚类区间及对应概率值作为最终结果。/n

【技术特征摘要】
1.一种可排除错误信息的多模型不确定再现结果分析方法,其特征在于:无需专家意见就能将事故再现区间结果、概率结果、区间/概率混合结果中错误的信息剔除,并给出最终融合结果,具体实施步骤如下:
S1:根据事故再现结果所服从的分布情况将结果离散化,得样本集M;
S2:对M中样本进行聚类;
S3:统计各样本到所属聚类中心的距离,形成样本集P;
S4:根据P的上界设置距离阀值d;
S5:将P中距离大于d的样本剔除,得到样本集N;
S6:统计N中样本点落在各聚类区间的频数并将其视为各个聚类区间的概率,进而输出聚类区间及对应概率值作为最终结果。


2.根据权利要求1所述的一种可排除错误信息的多模型不确定再现结果分析方法,其特征在于:步骤S1中再现结果包括区间结果、概率结果,区间结果视为服从均匀分布的概率结果。


3.根据权利要求1所述的一种可排除错误信息的多模型不确定再现结果分析方法,其特征在于:步骤S1中对结果进行离散化为在结果区间内根据其概率信息生成随机数,随机数的个数为n,为保证结果的稳定性,n不应少于107。


4.根据权利要求1所述的一种可排除错误信息的多模型不确定再现结果分析方法,其特征在于:步骤S1中样本集M由所有离散化结果组成;对于一个具有m个不确定结果且每个结果生成有n个随机数的问题,M的样本数应为m×n个。


5.根据权利要求1所述的一种可排除错误信息的...

【专利技术属性】
技术研发人员:邹铁方何枫林
申请(专利权)人:长沙理工大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1