一种基于孪生网络的内部威胁的检测方法及系统技术方案

技术编号：32883274 阅读：16 留言：0更新日期：2022-04-02 12:17

本发明专利技术涉及一种基于孪生网络的内部威胁的检测方法及系统，其方法包括：S1：获取内部威胁测试数据集进行预处理，构建样本集，将样本集划分为训练集、待检测样本集和标准样本集；S2：从训练集随机选取一个样本对及其类别标签构成输入三元组，将三元组输入孪生网络模型，计算得到的两个二维样本向量的欧式距离，并根据预设阈值，以判定二者是否属于同一类别；步骤S3：分别从待检测样本集和标准样本集各取一个样本，输入训练好的孪生网络模型，判断二者是否属于同一类别，从而确定待检测样本的类别。本发明专利技术提供的检测方法，全面地分析用户行为，实现更加准确地内部威胁检测，且对于数据集是否平衡不敏感，提高了系统的智能性。提高了系统的智能性。提高了系统的智能性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于孪生网络的内部威胁的检测方法及系统

[0001]本专利技术涉及信息安全
，具体涉及一种基于孪生网络的内部威胁的检测方法及系统。

技术介绍

[0002]随着科学技术的飞速发展，越来越多的企业和组织借助计算机网络实现资源共享、信息交换、互操作等运营管理方式，但随之而来的还有无法估量的网络安全威胁。随着防火墙、防病毒软件、入侵检测等安全产品的广泛应用，企业逐渐可以应对网络外部产生的安全威胁，但由内部人员造成安全威胁是企业和组织难以预料和防范的。因为内部威胁的主要攻击者是企业或组织员工(包括在职和离职)、承包商、商业伙伴以及第三方的服务提供方等，他们更加了解企业内部结构，具有企业和组织的系统、网络、数据的访问权限，所以内部威胁具有更高的隐蔽性、危险性、多元性，外部的安全防御手段对其几乎不起作用。因此，当内部人员变得不再可靠时，真正的解决方法就是设计构建一种有效的内部威胁检测方法。
[0003]为了应对内部威胁，目前的解决方法大致可以分为两类。第一类是特征工程和分类器的结合。具体来说，研究人员通过特征工程从原始日志中提取频率或统计特征，并将其输入到机器学习或深度学习的分类器中。但随着企业规模不断扩大和内部复杂性的提高，网络异常事件占据极小比例，该方法逐渐展现出弊端。首先是特征工程高度依赖于专家领域知识，这使得特征提取过程既耗时又昂贵。其次，由于内部威胁数据集的高度不平衡，分类器的效果并不稳定。最后，提取到的数值特征难以关联和融合多个对数域的潜在信息。第二类是应用异常检测来解决内部威胁问题。为了避免数据集的...

【技术保护点】

【技术特征摘要】
1.一种基于孪生网络的内部威胁的检测方法，其特征在于，包括：步骤S1：获取内部威胁测试数据集进行预处理，将用户每天的行为活动表示为灰度图，构建样本集，将所述样本集划分为训练集、待检测样本集和标准样本集；步骤S2：从所述训练集随机选取一个样本对(X1,X2)及其类别标签Y构成输入三元组(X1,X2,Y)，将所述三元组输入孪生网络模型，依次经过卷积层、池化层和全连接层，得到二维样本向量；计算两个所述二维样本向量的欧式距离，并根据预设阈值，以判定二者是否属于同一类别；将所述孪生网络模型输出类别与所述类别标签Y进行比对，构建对比损失函数计算损失并迭代训练模型，直到得到训练好的孪生网络模型；步骤S3：分别从所述待检测样本集和所述标准样本集各取一个样本，输入所述训练好的孪生网络模型，判断二者是否属于同一类别，从而确定待检测样本的类别。2.根据权利要求1所述的基于孪生网络的内部威胁的检测方法，其特征在于，所述步骤S1：获取内部威胁测试数据集进行预处理，将用户每天的行为活动表示为灰度图，构建样本集，将所述样本集划分为训练集、待检测样本集和标准样本集，具体包括：步骤S11：获取内部威胁测试数据集，包括：用户登录日志、移动设备连接日志、文件访问日志、邮件通信日志以及网络浏览日志数据，以及每个所述用户所属职位、部门、工作期限和参与项目的LDAP数据；从上述日志数据中提取所述用户每天的日志数据构成一个活动集合，用于代表该用户一天的所有行为；步骤S12：从所述活动集合提取该用户一天的活动信息，并按时间和活动类型编码构成活动矩阵；步骤S13：将所述活动矩阵按照灰度图转化标准转化为灰度图，如公式(1)所示，构建得到样本集；其中，每张所述灰度图代表一个所述用户一天所有活动信息；其中，I
i,j
表示第i个用户在第j天的活动灰度图表示，表示该用户一天的活动编码矩阵，f表示矩阵转化灰度图函数；步骤S14：按预设比例随机将样本集分成三份，分别为训练集、待检测样本集和标准样本集。3.根据权利要求1所述的基于孪生网络的内部威胁的检测方法，其特征在于，所述步骤S2：从所述训练集随机选取一个样本对(X1,X2)及其类别标签Y构成输入三元组X1,X2,Y)，将所述三元组输入孪生网络模型，依次经过卷积层、池化层和全连接层，得到二维样本向量；计算两个所述二维样本向量的欧式距离，并根据预设阈值，以判定二者是否属于同一类别；将所述孪生网络模型输出类别与所述类别标签Y进行比对，构建对比损失函数计算损失并迭代训练模型，直到得到训练好的孪生网络模型，具体包括：步骤S21：构建所述孪生网络模型，包括：卷积层、池化层和全连接层，输入所述三元组(X1,X2,Y)，输出为两个二维样本向量V，如公式(2)所示：V＝CNN((I
i，j

【专利技术属性】
技术研发人员：王利明，井春蕾，侯雨桥，卢至彤，陈凯，周少磊，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人