System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及网络安全,特别涉及一种基于大数据日志的异常检测模型的训练方法及检测方法。
技术介绍
1、系统日志对于系统故障排查、数据分析、网络安全都具有重要的作用。目前,对于大规模信息系统,通常每天产生的日志数据都以百万计,日志数据中包含正常日志信息和异常日志信息,大量的日志数据导致对每条日志信息做正常类别和异常类别标注时标注效率很慢,且通常日志数据中大部分都为正常日志信息,异常日志信息很少,难以保证在大量的日志数据中检测异常日志信息的准确度,因此需提高对数以百万计甚至更多的日志数据中异常日志信息检测的准确性和效率。
2、因而现有技术还有待改进和提高。
技术实现思路
1、本申请要解决的技术问题在于提高对数以百万计甚至更多的日志数据中异常日志信息检测的准确性和效率,针对现有技术的不足,提供一种基于大数据日志的异常检测模型的训练方法及检测方法。
2、为了解决上述技术问题,本申请实施例第一方面提供了一种基于大数据日志的异常检测模型的训练方法,其中,所述的基于大数据日志的异常检测模型的训练方法具体包括:
3、对原始日志数据进行去冗余操作,以得到简化训练日志数据;
4、将简化训练日志数据中的每条日志信息输入初始异常检测模型中的预训练语言模型,通过预训练语言模型确定每条日志信息的语义向量;
5、将每条语义向量输入所述初始异常检测模型中的transformer模型,通过transformer模型确定每条日志信息对应的第一预测类别;
< ...【技术保护点】
1.一种基于大数据日志的异常检测模型的训练方法,其特征在于,所述的基于大数据日志的异常检测模型的训练方法具体包括:
2.根据权利要求1所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述基于每条日志信息对应的第一预测类别和标注类别,对初始异常检测模型进行训练,以得到异常检测模型之后,所述方法还包括:
3.根据权利要求2所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述基于更新简化训练日志数据对所述异常检测模型进行微调之后,所述方法还包括:
4.根据权利要求1所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述对原始日志数据进行去冗余操作,以得到简化训练日志数据具体包括:
5.根据权利要求1所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述对原始日志数据进行去冗余操作,以得到简化训练日志数据之后,所述方法还包括:
6.根据权利要求5所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述对所述简化训练日志数据进行数据平衡处理具体包括:
7.一种基于大数据日志的网
8.根据权利要求7所述的基于大数据日志的网络安全异常检测方法,其特征在于,将所述简化日志数据输入经过训练的异常检测模型,通过所述异常检测模型确定所述待检测日志数据对应的异常日志信息之后,所述方法还包括:
9.根据权利要求8所述的基于大数据日志的网络安全异常检测方法,其特征在于,所述基于所述微调数据集对所述异常检测模型进行微调之前,所述方法还包括:
10.一种终端设备,其特征在于,包括:处理器和存储器;
...【技术特征摘要】
1.一种基于大数据日志的异常检测模型的训练方法,其特征在于,所述的基于大数据日志的异常检测模型的训练方法具体包括:
2.根据权利要求1所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述基于每条日志信息对应的第一预测类别和标注类别,对初始异常检测模型进行训练,以得到异常检测模型之后,所述方法还包括:
3.根据权利要求2所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述基于更新简化训练日志数据对所述异常检测模型进行微调之后,所述方法还包括:
4.根据权利要求1所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述对原始日志数据进行去冗余操作,以得到简化训练日志数据具体包括:
5.根据权利要求1所述的基于大数据日志的异常检测模型的训练方法,其特征在于,所述对原始日志数据进行去冗余操作,以得到简化训练日志数据之...
【专利技术属性】
技术研发人员:周志胜,夏杰,刘伟平,
申请(专利权)人:深圳市网安信科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。