一种系统日志自动化分类的方法及装置制造方法及图纸

技术编号：35205496 阅读：17 留言：0更新日期：2022-10-15 10:16

本发明专利技术涉及日志检索技术领域，具体提供了一种系统日志自动化分类的方法，使用预训练模型，读取数据后进行特征转换，将特征向量输入至卷积神经网络进行进一步的特征提取，使用验证集调整参数，得到训练好的模型，从中挑选出最优的模型。与现有技术相比，本发明专利技术通过深度学习语言模型对日志自动化分类，Bert模型强大的预测能力可以有效提升分类准确性，利用卷积神经网络可以捕捉局部特征的优点可以对Bert分类模型进行优化，进一步提升准确性。进一步提升准确性。进一步提升准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种系统日志自动化分类的方法及装置

[0001]本专利技术涉及日志检索
，具体提供一种系统日志自动化分类的方法及装置。

技术介绍

[0002]注意力机制(Attention Mechanism)是深度学习中的重要组成部分，它是受到人脑注意力机制的启发。在人类的感知过程中，一般可以瞬间注意到最相关的部分，并将注意力集中于此。自注意力机制(self
‑
attention)有一样的来源，在自然语言处理中，它的来源是文本信息，自注意力机制对文本本身计算来捕获文本的语义信息以及单词之间的依存关系。
[0003]多头自注意力编码器由于可以执行大规模并行计算而且可以获取句子中每个位置的长距离依赖关系，因此在自然语言处理领域得到了广泛使用。一般多头自注意力编码器由两层组成，分别是多头自注意力机制和前馈神经网络，每层添加一个残差连接和层标准化，它的输入增加了对句子的位置嵌入。自注意力机制是多头自注意力编码器的关键，属于注意力机制的一种。它可以计算句子间的相互影响，减少了外部信息对其本身的干扰，更专注的捕捉特征内部的相互关系，解决了长距离依赖问题。
[0004]深度学习模型性能由很多因素决定，其训练数据的规模影响很大。为了让模型学习到更多的特征内容，就必须扩大其规模。相关的研究人员开始寻找大规模的无监督数据，使用这些大规模的数据训练模型，这些模型具有预设的学习目标，可以有效提升模型的鲁棒性和泛化能力。
[0005]Bert(Bidirectional Encoder Representat...

【技术保护点】

【技术特征摘要】
1.一种系统日志自动化分类的方法，其特征在于，使用预训练模型，读取数据后进行特征转换，将特征向量输入至卷积神经网络进行进一步的特征提取，使用验证集调整参数，得到训练好的模型，从中挑选出最优的模型。2.根据权利要求1所述的一种系统日志自动化分类的方法，其特征在于，具体步骤如下：S1、将已有的日志文件信息分类，分为训练集、测试集和验证集；S2、为数据建立迭代器；S3、将特征向量作为Embeddings输入卷积神经网络；S4、在卷积神经网络中进行训练，对训练分为多个epoch；S5、在测试时，使用特定函数来调用训练过程中保存的最优模型；S6、使用精确率P、召回率R和F1值作为评测指标。3.根据权利要求1所述的一种系统日志自动化分类的方法，其特征在于，在步骤S1中，将已有的日志文件信息分好类，在句首均添加所属类别，存于一个文档中，并按照一定比例将所有的信息分成训练集、测试集和验证集。4.根据权利要求3所述的一种系统日志自动化分类的方法，其特征在于，在步骤S2中，在读取数据集的数据后，Bert的预训练模型对文本语句进行特征转换，作为分类模型的输入向量；Bert模型的输入用一个标记序列明确的表示单个文本句子和成对的文本句子，输入嵌入用字向量、段向量和位置向量的总和来表示。5.根据权利要求4所述的一种系统日志自动化分类的方法，其特征在于，在步骤S3中，对数据完成特征转换之后，将特征向量作为Embeddings输入卷积神经网络，送入模型中开始训练，使用BertAdam算法进行参数优化。6.根据权利要...

【专利技术属性】
技术研发人员：高嘉翾，
申请(专利权)人：浪潮软件集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人