【技术实现步骤摘要】
一种基于决策树的漏洞分类检测方法
[0001]本专利技术涉及系统安全
,具体涉及一种基于决策树的漏洞分类检测方法。
技术介绍
[0002]在安全形势日益严重的今天,大大小小的系统都有被攻击的风险,系统的安全防护问题变得越来越重要。但当前,系统的开发者和维护者对于安全风险的认识不足,依旧把系统的功能和需求作为第一导向,这导致许多系统仍存在着巨大的安全隐患。
[0003]现如今市场整体对于一些系统漏洞问题并没有过多关注,不少系统存在防护措施不当的问题,更多的系统会因为成本原因无法得到安全防护服务,造成自身暴露在互联网环境中,极易遭受攻击者利用漏洞进行攻击。而随着各种各样的漏洞层出不穷,对于漏洞的防御措施也越来越多,对于具有特定特征的漏洞,往往会有特定的漏洞修复方法。
[0004]因此为了更高效率地检测和防御系统中可能出现的漏洞风险,本专利技术提供了一种基于决策树的漏洞分类检测方法,从漏洞呈现的各种特征出发来尽可能地检测各种漏洞类型,从而更好地制定安全策略以确保系统的安全性和可靠性。
技术实现思路
r/>[0005]本本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于决策树的漏洞分类检测方法,其特征在于它包含如下步骤:S1.数据采集:使用Python爬虫技术对漏洞数据库中漏洞相关数据进行爬取,并对爬取到的数据信息进行筛选,构成初步的数据集,接着对漏洞的共有属性进行提取形成特征集合,由于特征集合中非数值特征的存在,需要将其转化为数值特征;S2.数据优化:将数据集中的几种数据类型用数字替代后,再对数字化的数据进行归一化处理,使每一个值都在[0,1]范围内,保证分类器可以同等对待每个特征;为了方便提取数据的主要特征,将使用主成分分析(PCA)方法,计算原数据的特征向量和特征值,通过从小到大排序特征值,保留前一部分特征向量,对数据进行降维操作;S3.确定分类顺序:将数据集中的任意一个漏洞类型样例作为正例,将其他的漏洞类型作为反例,以此分为不同类别的分类器,即拆分成不同数量的二分类任务;计算各类样本数据的类间距离,将类间距离按从大到小进行排序并分离,然后创建一个根节点,确定优先级最高分类类别D1,将训练集数据的结果分为属于D1和不属于D1的两个类别;选择欧氏距离作为各类别之间的中心距离,欧氏距离在数学中表示两点在空间中的欧几里得距离,有时被称为勾股距离;n维空间中的欧式距离公式为:S4.设置GiNi系数阈值,在步骤S3的基础上建立CART决策树;S5.当训练完CART决策树后,输出所有预测结果为D1的样本,将D1样本从数据集中删除,再用D2类别来分离接下来的样本数据;分类后的结果分别是属于D2的样本和不属于D2的剩余样本,再接着继续构建剩余样本的决策树;S6.对步骤S3、...
【专利技术属性】
技术研发人员:吴艳,虞雁群,刘彦伸,郭银锋,
申请(专利权)人:浙江御安信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。