告警数据规则挖掘方法、装置及电子设备制造方法及图纸

技术编号：25598532 阅读：22 留言：0更新日期：2020-09-11 23:56

本申请提供了一种告警数据规则挖掘方法、装置及电子设备，其中，该方法包括：将采集的告警数据集中的每条告警数据进行处理，以得到每条告警数据的词向量表示，告警数据集包括多条告警数据，每条告警数据中包括计算机异常信息；将每条告警数据的词向量表示进行聚类训练，以得到每条告警数据的词向量表示的聚类标识；根据所有的词向量表示的聚类标识形成的告警序列，使用关联分析算法对告警数据集中的每条告警数据进行关联分析，以得到告警频繁模式集。

全部详细技术资料下载

【技术实现步骤摘要】
告警数据规则挖掘方法、装置及电子设备
本申请涉及计算机
，具体而言，涉及一种告警数据规则挖掘方法、装置及电子设备。
技术介绍
在计算机的安全监控中，一般会监控过程中采集日志数据，以使运维人员根据日志数据进行排查错误、修复相关告警等。但实际中，日志数据存在数据量大、稀疏性高、相互独立、没有关联性等问题。
技术实现思路
有鉴于此，本申请实施例的目的在于提供一种告警数据规则挖掘方法、装置及电子设备。能够解决上述日志数据之间存在关联性不足的效果。第一方面，本申请实施例提供了一种告警数据规则挖掘方法，包括：将采集的告警数据集中的每条告警数据进行处理，以得到每条告警数据的词向量表示，所述告警数据集包括多条告警数据，每条告警数据中包括计算机异常信息；将每条告警数据的词向量表示进行聚类训练，以得到每条告警数据的词向量表示的聚类标识；根据所有的词向量表示的聚类标识形成的告警序列，使用关联分析算法对所述告警数据集中的每条告警数据进行关联分析，以得到告警频繁模式集。在一种可选的实施方式中，所述将所述告警数据集中的每条告警数据进行处理，以得到每条告警数据对应的词向量表示的步骤，包括：将所述告警数据集中的每条告警数据进行词向量计算，以得到每条告警数据中所包含的多个词向量；使用指定统计算法计算每条告警数据中包含的各个词向量的权重，以得到每条告警数据词向量表示。本申请实施例提供的告警数据规则挖掘方法，通过向确定每个词对应的词向量，基于多个词向量得出每条告警数...

【技术保护点】
1.一种告警数据规则挖掘方法，其特征在于，包括：/n将采集的告警数据集中的每条告警数据进行处理，以得到每条告警数据的词向量表示，所述告警数据集包括多条告警数据，每条告警数据中包括计算机异常信息；/n将每条告警数据的词向量表示进行聚类训练，以得到每条告警数据的词向量表示的聚类标识；/n根据所有的词向量表示的聚类标识形成的告警序列，使用关联分析算法对所述告警数据集中的每条告警数据进行关联分析，以得到告警频繁模式集。/n

【技术特征摘要】
1.一种告警数据规则挖掘方法，其特征在于，包括：
将采集的告警数据集中的每条告警数据进行处理，以得到每条告警数据的词向量表示，所述告警数据集包括多条告警数据，每条告警数据中包括计算机异常信息；
将每条告警数据的词向量表示进行聚类训练，以得到每条告警数据的词向量表示的聚类标识；
根据所有的词向量表示的聚类标识形成的告警序列，使用关联分析算法对所述告警数据集中的每条告警数据进行关联分析，以得到告警频繁模式集。

2.根据权利要求1所述的方法，其特征在于，所述将所述告警数据集中的每条告警数据进行处理，以得到每条告警数据对应的词向量表示的步骤，包括：
将所述告警数据集中的每条告警数据进行词向量计算，以得到每条告警数据中所包含的多个词向量；
使用指定统计算法计算每条告警数据中包含的各个词向量的权重，以得到每条告警数据词向量表示。

3.根据权利要求2所述的方法，其特征在于，所述将所述告警数据集中的每条告警数据进行词向量计算，以得到每条告警数据中所包含的多个词向量的步骤，包括：
将所述告警数据集中的每条告警数据进行分词处理，以得到每条告警数据中所包含的多个词；
将每条告警数据中所包含的多个词进行词向量计算，以得到每条告警数据对应的多个词向量。

4.根据权利要求3所述的方法，其特征在于，所述将所述告警数据集中的每条告警数据进行分词处理，以得到每条告警数据中所包含的多个词的步骤，包括：
将所述告警数据集进行去重处理，得到清洗告警数据集；
根据所述清洗告警数据集构建告警词典；
将所述告警词典中的每条告警数据进行分词处理，得到每条告警数据中所包含的多个词。

5.根据权利要求2所述的方法，其特征在于，所述使用指定统计算法计算每条告警数据中包含的各个词向量的权重，以得到每条告警数据词向量表示的步骤，包括：
使用TF-IDF算法计算每条告警数据中包含的各个词向量的权重，以得到每条告警数据词向量表示。

6.根据权利要求1所述的方法，其特征在于，所述根据所有的词向量表示的聚类标识形成的告警序列，使用关联分析算法对告警数据集中的每条告警数据进行关联分析，以得到告警频繁模式集的步骤，包括：
根据所有的词向...

【专利技术属性】
技术研发人员：王建华，田贵成，
申请(专利权)人：创新奇智上海科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人