一种基于大数据的突发事件演化推理方法及系统技术方案

技术编号:15250958 阅读:122 留言:0更新日期:2017-05-02 14:09
本发明专利技术公开了一种基于大数据的突发事件演化推理方法及系统,将数据库中的案例进行整合得到子事件链集合,将子事件链集合作为算法的输入,通过算法得到强、弱规则项集,从大于支持度的集合中,获得强规则项集,从小于或等于支持度的集合中,获得弱规则项集,其中,强规则项集作为常规突发事件演变可能路径,而弱规则项集作为非常规突发事件演变可能路径,并将强、弱规则项集作为推理的依据,从案例库中挖掘到最可能发生的后续子事件集合以及发生概率极小的后续子事件集合,可以改善Apriori算法只针对强规则项集的推论,将计算过程中强弱规则项集区分,均保留为目标数据。

A method and system for the evolution of burst events based on large data

The invention discloses a system evolution and reasoning method of emergency data based on the database in case of integration of the chain of events will get the sub set of sub chain of events set as the input of the algorithm through the algorithm to get the strong and weak rule set from the set is greater than the support degree, obtain strong rule set from the collection, less than or equal to the support degree, weak rule set, the strong rules set as emergencies evolution possible path, and weak rule sets as unconventional emergencies evolution possible path, and the strong and weak rules set for reasoning, mining to subsequent events subsequent events most likely set and probability of minimal set from the case base, can improve the Apriori algorithm for strong rule set inference, the calculation rules in the process of strength Item sets are distinguished, are reserved for the target data.

【技术实现步骤摘要】

本专利技术属于数据挖掘
,更具体地,涉及一种基于大数据的突发事件演化推理方法及系统
技术介绍
数据挖掘也称为在数据库中进行知识发现,数据挖掘的目的是从大型数据库中抽象出感兴趣的知识。从抽象模式来分析,决策过程可以很容易被完成。关联规则主要是基于发现频繁项集,零售店经常使用关联规则来协助营销,广告,库存控制,预测电信网络中的故障,其中主要使用的是关联规则算法Apriori算法,Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。随着非常规突发事件的发生越来越频繁,然而当前的突发事件预警预测方法大多从突发事件案例的宏观信息(如事件类型、资源类型等)出发,利用CBR、基于规则的推理(Rule-BasedReasoning,RBR)、基于模型的推理(Model-basedReasoning,MBR)等方法,然而采用上述方法并不能将案例最原本的信息关系挖掘出来,同时在一定程度上忽略了常规突发事件与非常规突发事件的区别,具有一定的局限性。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于大数据的突发事件演化推理方法及系统,在Apriori算法的基础上得到改进的推理算法,利用结构化的突发事件案例库的相关信息从突发事件的子事件链出发,可以从案例库中挖掘到最可能发生的后续子事件集合以及发生概率极小的后续子事件集合。由此解决现有技术中对案例推理忽略案例基本信息间关系的缺陷,以及忽略了常规突发事件与非常规突发事件的区别的技术问题。为实现上述目的,按照本专利技术的一个方面,提供了一种基于大数据的突发事件演化推理方法,包括:(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=0,…,n-1;(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。按照本专利技术的另一方面,提供了一种基于大数据的突发事件演化推理系统,包括:子事件链生成模块,用于获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;项集生成模块,用于针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;合成模块,用于将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=0,…,n-1;强弱规则项生成模块,用于以子事件链生成模块得到的所有子事件链以及合成模块得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;事件推理模块,用于根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,主要有以下的技术优点:数据集合不固定,将数据源进行关联组合与Apriori算法的固定数据集合不同;改善Apriori算法只针对强规则项集的推论,将计算过程中强弱规则项集区分,均保留为目标数据。附图说明图1为本专利技术实施例公开的一种基于大数据的突发事件演化推理方法的流程示意图;图2为本专利技术实施例公开的一种基于大数据的突发事件演化推理系统的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。图1为本专利技术实施例公开的一种基于大数据的突发事件演化推理方法的流程示意图,在图1所示的方法中具体包括以下步骤:(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=0,…,n-1;(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。通过图1所示的方法得到的数据集合不固定,并可以将数据源进行关联组合,并且可以区分强弱规则项,依据强弱规则项得到常规突发事件演变的可能路径或非常规突发事件演变的可能路径。为了便于对本专利技术提出的基于大数据的突发事件演化推理方法的理解,下面以一个具体的例子来描述该方法中数据集的实现过程。假设有如下三条事件链:案例1:A1→B1→C1→D1→E1案例2:A2→C1→B2→D3案例3:A1→B2→C1→D3针对每个案例的子事件链,获取子事件链的二项集\\三项集\\…\\n项集:进行元素合并得到合并之后的项集:I)AlBlClB2D32)A1B2C1D33)……针对每一条子事件链以及合并之后的项集,利用Apriori算法分别求出强规则项以及出现概率极低的项(即弱规则项)。最终推理出与用户输入的事件对应的后续可能发生的事件集合。图2所示为本法实施例公开的一种基于大数据的突发事件演化推本文档来自技高网...

【技术保护点】
一种基于大数据的突发事件演化推理方法,其特征在于,包括:(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=0,…,n‑1;(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。...

【技术特征摘要】
1.一种基于大数据的突发事件演化推理方法,其特征在于,包括:(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=0,…,n-1;(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。2.一种基于大数据的突发事件演化推...

【专利技术属性】
技术研发人员:佘廉陈曦贾传亮李慧嘉钟开斌郑琛秦子健
申请(专利权)人:国家行政学院华中科技大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1