基于对抗自编码器的无监督内部威胁检测方法技术

技术编号：39259162 阅读：10 留言：0更新日期：2023-10-30 12:10

本发明专利技术属于用户异常行为检测技术领域，公开了基于对抗自编码器的无监督内部威胁检测方法，其将用户行为原始日志数据的行为序列拆分为以会话为单位的子序列集合，并提取数值特征；将其输入至对抗自编码器中进行训练，得到训练后的正常行为模型；将待检测的用户日志进行特征提取后输入训练后的正常行为模型中，计算数值特征的重构误差的和并作为会话中用户行为的威胁得分，判断该段会话中是否存在威胁。本发明专利技术使用无监督学习的方法训练正常用户行为序列，不需要预定义的标签或其他先验知识，使用对抗学习约束了编码器输出的不确定性，提高了模型对多维时序行为序列的重构准确度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
基于对抗自编码器的无监督内部威胁检测方法

[0001]本专利技术属于用户异常行为检测
，具体是涉及基于对抗自编码器的无监督内部威胁检测方法。

技术介绍

[0002]随着各行业对信息系统的采用逐步增加，其业务运作的信息化程度和工作运作的效率迅速提高。然而，入侵和破坏对信息系统造成的危害也越来越严重。安全保护的边界变得模糊，系统的安全需求逐渐演变，内部人员不再值得信任。来自内部人员的威胁和攻击已经成为一个值得关注的安全风险。与传统的外部人员入侵不同，内部人员往往是企业安全保护的盲点，攻击行为会更具破坏性，因为他们更熟悉组织结构和有价值的关键属性或内容。因此，内部威胁检测是当前需要解决的重要问题之一。
[0003]当前，目前的内部威胁检测方法主要分为两类：一是基于规则的方法：利用专家知识生成先验规则，通过判断是否存在预定义的危险行为模式来检测内部威胁行为；随着攻击方法的逐步升级和渗透隐蔽性的提高，基于规则的方法逐渐无法胜任威胁检测；另一种是数据驱动方法，利用机器学习发现系统历史日志数据中用户行为正常或异常的特征，从而实现对当前用户行为的异常检测。然而，由于在真实场景下用户行为数据为不平衡数据集，其中的威胁行为存在数据量少、正负样本数量不均地问题，异常行为与正常行为的比例约为0.1%，甚至更低。由于缺乏足够的可用异常标签信息，传统的监督学习难以满足多分类或二分类问题的需要；同时内部威胁行为往往潜伏周期长、且尽可能模仿正常行为，这导致包含隐马尔可夫、支持向量机等传统机器学习方法难以在内部用户行为检测领域展现出有效...

【技术保护点】

【技术特征摘要】
1.基于对抗自编码器的无监督内部威胁检测方法，其特征在于，包括以下步骤：S1、获取用户行为原始日志数据，并将所述用户行为原始日志数据的行为序列拆分为以会话为单位的子序列集合，对子序列中的行为信息进行聚合和提取，生成固定长度的数字向量表示用户在这一会话内的操作；并将会话内的用户行为信息提取为数值特征；S2、将提取的数值特征分别输入至LSTM自编码器模型及TL
‑
AAE自编码器模型中进行训练，得到训练后的正常行为模型；S3、将待检测的用户日志进行特征提取后输入训练后的正常行为模型中，计算用户待检测数据的数值特征的重构误差的和，将其作为会话中用户行为的威胁得分，并判断该段会话中是否存在威胁。2.根据权利要求1所述的基于对抗自编码器的无监督内部威胁检测方法，其特征在于，S1中，对于采集到的原始多源用户日志，统一用户行为的描述形式，将用户行为分为不同类型并进行编号，将其聚合为一条用户行为序列，其中表示用户在系统上执行的某一种类型操作；将聚合的用户行为序列会话为单位拆分为多个子序列，将每个用户登录系统到退出系统期间设置为一个会话，即令用户行为序列转变为多个子序列集合。3.根据权利要求2所述的基于对抗自编码器的无监督内部威胁检测方法，其特征在于，提取的数值特征为事件频率特征和时间特征；对于每个子序列，统计其中不同类型行为的发生次数，构成此子行为序列的事件频率特征矩阵，，其中，，，m表示子序列会话的长度，d表示设定的特征维数，即设置的行为类型数量；表示第i个员工的会话，表示第i个事件频率特征，表示全部会话的事件频率特征；每个子序列的时间信息，统计其起始时间、终止时间、子序列持续时间，并与事件频率特征矩阵对应构成时间特征矩阵。4.根据权利要求1所述的基于对抗自编码器的无监督内部威胁检测方法，其特征在于，所述TL
‑
AAE自编码器模型包括编码器模块E、解码器模块G、判别器模块D和先验分布生成器模块；编码器模块E对输入进行处理后输出当前时刻的状态信息；解码器模块G将编码器模块E输出的结果重构为原始序列；采用均方差误差作为损失函数，定义如下：，其中，为输入序列长度，为编码器函数，表示由输入得到潜在特
征，为解码器函数，...

【专利技术属性】
技术研发人员：孙雁飞，周振国，朱行健，董建阔，亓晋，董振江，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人