关联规则挖掘方法、装置、设备及存储介质制造方法及图纸

技术编号:37441300 阅读:10 留言:0更新日期:2023-05-06 09:13
本发明专利技术公开了一种关联规则挖掘方法、装置、设备及存储介质,该关联规则挖掘方法包括:对云化网络中各网元产生的原始数据进行预处理,得到目标数据;根据各网元间的连接关系生成云化网络拓扑图,并根据云化网络拓扑图生成拓扑关系;对目标数据进行频繁项集挖掘处理,得到频繁项集合;其中,频繁项集合中包含多个数据项;采用拓扑关系验证频繁项集合中各数据项间的关联关系,以确定目标频繁项集合;根据目标频繁项集合中各数据项间的关联关系确定关联规则集合。本发明专利技术实施例通过将云化网络中各网元的拓扑关系与频繁项集挖掘相结合,可以去除关联关系上无逻辑的数据项,进而得到较为准确的关联规则集合,提高后续的数据挖掘效率。率。率。

【技术实现步骤摘要】
关联规则挖掘方法、装置、设备及存储介质


[0001]本专利技术涉及大数据
,具体涉及一种关联规则挖掘方法、装置、设备及存储介质。

技术介绍

[0002]随着虚拟化网络的发展及普及,网络架构也演进的越来越复杂。由网络设备产生的数据(例如告警),从原来的硬件设备,演进为硬件设备与虚拟设备相互影响、相互作用的复杂数据。在此背景下,数据量出现倍数增长,面对百万级的海量数据,通常使用关联规则来梳理数据间的关联。
[0003]在现有技术中,通过获取某个时间段内的所有数据,把数据作为关联规则算法的输入,生成数据之间的关联规则。例如在专利(公开号CN111431736A)中,将数据之间的信息转化为向量之间的关系,根据向量之间的关系得到近似的频繁项,再根据近似的频繁项生成关联规则。
[0004]但是,通过上述方法确定的关联规则中存在无效的关联规则,导致闭环效率较低。

技术实现思路

[0005]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的关联规则挖掘方法、装置、设备及存储介质。
[0006]根据本专利技术实施例的一个方面,提供了一种关联规则挖掘方法,包括:
[0007]对云化网络中各网元产生的原始数据进行预处理,得到目标数据;
[0008]根据所述各网元间的连接关系生成云化网络拓扑图,并根据所述云化网络拓扑图生成拓扑关系;
[0009]对所述目标数据进行频繁项集挖掘处理,得到频繁项集合;其中,所述频繁项集合中包含多个数据项;
[0010]采用所述拓扑关系验证所述频繁项集合中各数据项间的关联关系,以确定目标频繁项集合;
[0011]根据所述目标频繁项集合中各数据项间的关联关系确定关联规则集合。
[0012]根据本专利技术实施例的另一方面,提供了一种关联规则挖掘装置,包括:
[0013]预处理模块,用于对云化网络中各网元产生的原始数据进行预处理,得到目标数据;
[0014]关联关系生成模块,用于根据所述各网元间的连接关系生成云化网络拓扑图,并根据所述云化网络拓扑图生成拓扑关系;
[0015]频繁项集确定模块,用于对所述目标数据进行频繁项集挖掘处理,得到频繁项集合;其中,所述频繁项集合中包含多个数据项;
[0016]关联关系验证模块,用于采用所述拓扑关系验证所述频繁项集合中各数据项间的关联关系,以确定目标频繁项集合;
[0017]关联规则确定模块,用于根据所述目标频繁项集合中各数据项间的关联关系确定关联规则集合。
[0018]根据本专利技术实施例的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0019]所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述关联规则挖掘方法的操作。
[0020]根据本专利技术实施例的另一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述关联规则挖掘方法的操作。
[0021]根据本专利技术上述实施例提供的方案,将云化网络中各网元的拓扑关系与频繁项集挖掘相结合,可以去除关联关系上无逻辑的数据项,进而得到较为准确的关联规则集合,提高后续的数据挖掘效率。
[0022]上述说明仅是本专利技术实施例技术方案的概述,为了能够更清楚了解本专利技术实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术实施例的具体实施方式。
附图说明
[0023]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0024]图1示出了本专利技术实施例一提供的关联规则挖掘方法流程图;
[0025]图2示出了本专利技术实施例一提供的关联规则挖掘方法中的纵向拓扑关系示意图;
[0026]图3示出了本专利技术实施例一提供的关联规则挖掘方法中的横向拓扑关系示意图;
[0027]图4示出了本专利技术实施例二提供的关联规则挖掘方法的流程图;
[0028]图5示出了本专利技术实施例三提供的关联规则挖掘装置的结构示意图;
[0029]图6示出了本专利技术实施例提供的计算设备的结构示意图。
具体实施方式
[0030]下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。
[0031]实施例一
[0032]图1示出了本专利技术实施例一提供的关联规则挖掘方法的流程图。如图1所示,该方法包括以下步骤:
[0033]步骤S110、对云化网络中各网元产生的原始数据进行预处理,得到目标数据。
[0034]其中,云化网络可以对应多种应用场景,其中一种可实现的应用场景为告警管理系统,网元为处于云化网络中的虚拟设备,包括客户端、交换机、主机、虚拟机和路由器等,其产生的原始数据与云化网络的应用场景有关联,例如,当云化网络为告警管理系统时,则
其网元产生的原始数据为告警。
[0035]另外,为了减少数据处理量,可以选取预设时间段(例如,一周内)的原始数据进行处理。并且,为了便于后续处理,可以将原始数据采用预设字段表示,即提取出原始数据中的关键字,由该关键字组成预设字段。例如,
[0036]其中,预处理可以为数据过滤处理和/或字段压缩处理。其中,数据过滤处理包括过滤掉如下数据中的至少一种数据:未使用的网元产生的数据、工程数据和非标准化数据。其中,未使用的网元产生的数据一般为调试阶段产生的数据,需要把它过滤掉。工程数据一般不需要关注,这里也把它过滤掉。非标准化数据一般没有统一的标准、关注度比较低、数据量较小,这里也把它过滤掉。
[0037]其中,字段压缩处理包括:将同质化的原始数据归为一组,并将每组数据的标识和发生时间作为目标数据。即一组标识可以标记一系列具有某些相同特性的数据,例如,数据ID为2005

001

125

10

000001,其可以标记专业为虚拟化

vEPC、厂家为爱立信、设备类型为PCRF、数据类型为原始数据等系列数据。由于发生时间为表征数据间关联的重要参考因素,因此本实施例将标识和数据的发生时间一起作为目标数据进行后续的处理。
[0038]步骤S120、根据各网元间的连接关系生成云化网络拓扑图,并根据云化网络拓扑图生成拓扑关系。
[0039]在云化网络中各网元间有固定的连接关系,基于该连接关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关联规则挖掘方法,其特征在于,包括:对云化网络中各网元产生的原始数据进行预处理,得到目标数据;根据所述各网元间的连接关系生成云化网络拓扑图,并根据所述云化网络拓扑图生成拓扑关系;对所述目标数据进行频繁项集挖掘处理,得到频繁项集合;其中,所述频繁项集合中包含多个数据项;采用所述拓扑关系验证所述频繁项集合中各数据项间的关联关系,以确定目标频繁项集合;根据所述目标频繁项集合中各数据项间的关联关系确定关联规则集合。2.根据权利要求1所述的方法,其特征在于,所述云化网络拓扑图为纵向云化网络拓扑图,所述拓扑关系为纵向拓扑关系;和/或,所述云化网络拓扑图为横向云化网络拓扑图,所述拓扑关系为横向拓扑关系。3.根据权利要求1所述的方法,其特征在于,所述对原始数据进行预处理,包括:过滤掉如下数据中的至少一种数据:未使用的网元产生的数据、工程数据和非标准化数据。4.根据权利要求1所述的方法,其特征在于,所述对原始数据进行预处理,包括:将同质化的原始数据归为一组,并将每组数据的标识和发生时间作为目标数据。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标频繁项集合中各目标数据项间的关联关系确定关联规则,包括:根据所述目标频繁项集合中各目标数据项间的关联关系确定初始关联规则集合;采用所述初始关联规则集合中的各关联规则对预生产环境中各网元产生的生产数据进行挖掘,得到所述各关联规则的初始关联关系集合;根据所述预生产环境中各网元间的连接关系对各关联规则的初始关联关系集合中的关联关系进行验证,得到各关联规则的目标关联关系集合;根据各关联规则的目标关联关系集合对所述初始关联规则集合进行优化,得到最终的关联规则集合。6.根据权利要求5所述的方法,其特征在于,所述根据所述预生产环境中各网元间的连接关系对各关联规则...

【专利技术属性】
技术研发人员:韦佳明李冬领
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1