【技术实现步骤摘要】
关联规则挖掘方法、装置、设备及存储介质
[0001]本专利技术涉及大数据
,具体涉及一种关联规则挖掘方法、装置、设备及存储介质。
技术介绍
[0002]随着虚拟化网络的发展及普及,网络架构也演进的越来越复杂。由网络设备产生的数据(例如告警),从原来的硬件设备,演进为硬件设备与虚拟设备相互影响、相互作用的复杂数据。在此背景下,数据量出现倍数增长,面对百万级的海量数据,通常使用关联规则来梳理数据间的关联。
[0003]在现有技术中,通过获取某个时间段内的所有数据,把数据作为关联规则算法的输入,生成数据之间的关联规则。例如在专利(公开号CN111431736A)中,将数据之间的信息转化为向量之间的关系,根据向量之间的关系得到近似的频繁项,再根据近似的频繁项生成关联规则。
[0004]但是,通过上述方法确定的关联规则中存在无效的关联规则,导致闭环效率较低。
技术实现思路
[0005]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的关联规则挖掘方法、装置、设
【技术保护点】
【技术特征摘要】
1.一种关联规则挖掘方法,其特征在于,包括:对云化网络中各网元产生的原始数据进行预处理,得到目标数据;根据所述各网元间的连接关系生成云化网络拓扑图,并根据所述云化网络拓扑图生成拓扑关系;对所述目标数据进行频繁项集挖掘处理,得到频繁项集合;其中,所述频繁项集合中包含多个数据项;采用所述拓扑关系验证所述频繁项集合中各数据项间的关联关系,以确定目标频繁项集合;根据所述目标频繁项集合中各数据项间的关联关系确定关联规则集合。2.根据权利要求1所述的方法,其特征在于,所述云化网络拓扑图为纵向云化网络拓扑图,所述拓扑关系为纵向拓扑关系;和/或,所述云化网络拓扑图为横向云化网络拓扑图,所述拓扑关系为横向拓扑关系。3.根据权利要求1所述的方法,其特征在于,所述对原始数据进行预处理,包括:过滤掉如下数据中的至少一种数据:未使用的网元产生的数据、工程数据和非标准化数据。4.根据权利要求1所述的方法,其特征在于,所述对原始数据进行预处理,包括:将同质化的原始数据归为一组,并将每组数据的标识和发生时间作为目标数据。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标频繁项集合中各目标数据项间的关联关系确定关联规则,包括:根据所述目标频繁项集合中各目标数据项间的关联关系确定初始关联规则集合;采用所述初始关联规则集合中的各关联规则对预生产环境中各网元产生的生产数据进行挖掘,得到所述各关联规则的初始关联关系集合;根据所述预生产环境中各网元间的连接关系对各关联规则的初始关联关系集合中的关联关系进行验证,得到各关联规则的目标关联关系集合;根据各关联规则的目标关联关系集合对所述初始关联规则集合进行优化,得到最终的关联规则集合。6.根据权利要求5所述的方法,其特征在于,所述根据所述预生产环境中各网元间的连接关系对各关联规则...
【专利技术属性】
技术研发人员:韦佳明,李冬领,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。