一种基于大数据的突发事件演化推理方法及系统技术方案

技术编号：15250958 阅读：122 留言：0更新日期：2017-05-02 14:09

本发明专利技术公开了一种基于大数据的突发事件演化推理方法及系统，将数据库中的案例进行整合得到子事件链集合，将子事件链集合作为算法的输入，通过算法得到强、弱规则项集，从大于支持度的集合中，获得强规则项集，从小于或等于支持度的集合中，获得弱规则项集，其中，强规则项集作为常规突发事件演变可能路径，而弱规则项集作为非常规突发事件演变可能路径，并将强、弱规则项集作为推理的依据，从案例库中挖掘到最可能发生的后续子事件集合以及发生概率极小的后续子事件集合，可以改善Apriori算法只针对强规则项集的推论，将计算过程中强弱规则项集区分，均保留为目标数据。

A method and system for the evolution of burst events based on large data

The invention discloses a system evolution and reasoning method of emergency data based on the database in case of integration of the chain of events will get the sub set of sub chain of events set as the input of the algorithm through the algorithm to get the strong and weak rule set from the set is greater than the support degree, obtain strong rule set from the collection, less than or equal to the support degree, weak rule set, the strong rules set as emergencies evolution possible path, and weak rule sets as unconventional emergencies evolution possible path, and the strong and weak rules set for reasoning, mining to subsequent events subsequent events most likely set and probability of minimal set from the case base, can improve the Apriori algorithm for strong rule set inference, the calculation rules in the process of strength Item sets are distinguished, are reserved for the target data.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据挖掘
，更具体地，涉及一种基于大数据的突发事件演化推理方法及系统。
技术介绍
数据挖掘也称为在数据库中进行知识发现，数据挖掘的目的是从大型数据库中抽象出感兴趣的知识。从抽象模式来分析，决策过程可以很容易被完成。关联规则主要是基于发现频繁项集，零售店经常使用关联规则来协助营销，广告，库存控制，预测电信网络中的故障，其中主要使用的是关联规则算法Apriori算法，Apriori算法是一种挖掘关联规则的频繁项集算法，其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。随着非常规突发事件的发生越来越频繁，然而当前的突发事件预警预测方法大多从突发事件案例的宏观信息(如事件类型、资源类型等)出发，利用CBR、基于规则的推理(Rule-BasedReasoning，RBR)、基于模型的推理(Model-basedReasoning，MBR)等方法，然而采用上述方法并不能将案例最原本的信息关系挖掘出来，同时在一定程度上忽略了常规突发事件与非常规突发事件的区别，具有一定的局限性。
技术实现思路
针对现有技术的以上缺陷或改进需求，本专利技术提供了一种基于大数据的突发事件演化推理方法及系统，在Apriori算法的基础上得到改进的推理算法，利用结构化的突发事件案例库的相关信息从突发事件的子事件链出发，可以从案例库中挖掘到最可能发生的后续子事件集合以及发生概率极小的后续子事件集合。由此解决现有技术中对案例推理忽略案例基本信息间关系的缺陷，以及忽略了常规突发事件与非常规突发事件的区别的技术问题。为实现上述目的，按照本专利技术的一个方面，提供了一...

【技术保护点】
一种基于大数据的突发事件演化推理方法，其特征在于，包括：(1)获取预设案例库中所有的案例，遍历每个案例的子事件，根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链；(2)针对每个案例的子事件链，获取各案例对应的子事件链的二项集至n项集，其中，n为正整数；(3)将k项集中的各项进行两两比较，若比较的两项中存在相同的子事件，则进行合并得到合并项，比较合并项与k+1项集中的各项，若k+1项集中不包含合并项，则使合并项成为k+1项集的元素，其中，k＝0,…,n‑1；(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入，依据Apriori算法得到1项集，将1项集中居中的概率作为支持度，比较1项集中各元素的概率与支持度的关系，将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项，剔除在求解过程中产生的小于或等于支持度的项，直至得到强规则项，将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项，剔除在求解过程中产生的大于支持度的项，直至得到弱规则项；(5)根据用户输入的事件信息，以强规则项和弱规则项为依据，得到后续将会发生的子事件集合。...

【技术特征摘要】
1.一种基于大数据的突发事件演化推理方法，其特征在于，包括：(1)获取预设案例库中所有的案例，遍历每个案例的子事件，根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链；(2)针对每个案例的子事件链，获取各案例对应的子事件链的二项集至n项集，其中，n为正整数；(3)将k项集中的各项进行两两比较，若比较的两项中存在相同的子事件，则进行合并得到合并项，比较合并项与k+1项集中的各项，若k+1项集中不包含合并项，则使合并项成为k+1项集的元素，其中，k＝0,…,n-1；(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入，依据Apriori算法得到1项集，将1项集中居中的概率作为支持度，比较1项集中各元素的概率与支持度的关系，将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项，剔除在求解过程中产生的小于或等于支持度的项，直至得到强规则项，将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项，剔除在求解过程中产生的大于支持度的项，直至得到弱规则项；(5)根据用户输入的事件信息，以强规则项和弱规则项为依据，得到后续将会发生的子事件集合。2.一种基于大数据的突发事件演化推...

【专利技术属性】
技术研发人员：佘廉，陈曦，贾传亮，李慧嘉，钟开斌，郑琛，秦子健，
申请(专利权)人：国家行政学院，华中科技大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人