一种基于决策树的漏洞分类检测方法技术

技术编号:37334474 阅读:34 留言:0更新日期:2023-04-21 23:13
本发明专利技术公开了一种基于决策树的漏洞分类检测方法,它首先使用Python对漏洞数据库中的漏洞数据信息进行爬取,并整合成原始数据集;接着,选取数据特征和划分数据集,对划分的数据集进行数据优化,确定分类顺序,并设置GINI系数阈值来建立CART决策树;然后,对构建的模型进行合理的评估,根据准确率、错误率和运行时间来评估所构造模型的性能优劣。本发明专利技术所提出的基于类距离的决策树模型优于传统的决策树方法,更适合用于漏洞的分类检测。本发明专利技术方法匹配效果好,提取特征能力强,能够精确快速地匹配分类漏洞类型,大大提高了漏洞检测效率,从而提升整个系统应对漏洞安全风险的可靠性和时效性。性和时效性。性和时效性。

【技术实现步骤摘要】
一种基于决策树的漏洞分类检测方法


[0001]本专利技术涉及系统安全
,具体涉及一种基于决策树的漏洞分类检测方法。

技术介绍

[0002]在安全形势日益严重的今天,大大小小的系统都有被攻击的风险,系统的安全防护问题变得越来越重要。但当前,系统的开发者和维护者对于安全风险的认识不足,依旧把系统的功能和需求作为第一导向,这导致许多系统仍存在着巨大的安全隐患。
[0003]现如今市场整体对于一些系统漏洞问题并没有过多关注,不少系统存在防护措施不当的问题,更多的系统会因为成本原因无法得到安全防护服务,造成自身暴露在互联网环境中,极易遭受攻击者利用漏洞进行攻击。而随着各种各样的漏洞层出不穷,对于漏洞的防御措施也越来越多,对于具有特定特征的漏洞,往往会有特定的漏洞修复方法。
[0004]因此为了更高效率地检测和防御系统中可能出现的漏洞风险,本专利技术提供了一种基于决策树的漏洞分类检测方法,从漏洞呈现的各种特征出发来尽可能地检测各种漏洞类型,从而更好地制定安全策略以确保系统的安全性和可靠性。

技术实现思路
r/>[0005]本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于决策树的漏洞分类检测方法,其特征在于它包含如下步骤:S1.数据采集:使用Python爬虫技术对漏洞数据库中漏洞相关数据进行爬取,并对爬取到的数据信息进行筛选,构成初步的数据集,接着对漏洞的共有属性进行提取形成特征集合,由于特征集合中非数值特征的存在,需要将其转化为数值特征;S2.数据优化:将数据集中的几种数据类型用数字替代后,再对数字化的数据进行归一化处理,使每一个值都在[0,1]范围内,保证分类器可以同等对待每个特征;为了方便提取数据的主要特征,将使用主成分分析(PCA)方法,计算原数据的特征向量和特征值,通过从小到大排序特征值,保留前一部分特征向量,对数据进行降维操作;S3.确定分类顺序:将数据集中的任意一个漏洞类型样例作为正例,将其他的漏洞类型作为反例,以此分为不同类别的分类器,即拆分成不同数量的二分类任务;计算各类样本数据的类间距离,将类间距离按从大到小进行排序并分离,然后创建一个根节点,确定优先级最高分类类别D1,将训练集数据的结果分为属于D1和不属于D1的两个类别;选择欧氏距离作为各类别之间的中心距离,欧氏距离在数学中表示两点在空间中的欧几里得距离,有时被称为勾股距离;n维空间中的欧式距离公式为:S4.设置GiNi系数阈值,在步骤S3的基础上建立CART决策树;S5.当训练完CART决策树后,输出所有预测结果为D1的样本,将D1样本从数据集中删除,再用D2类别来分离接下来的样本数据;分类后的结果分别是属于D2的样本和不属于D2的剩余样本,再接着继续构建剩余样本的决策树;S6.对步骤S3、...

【专利技术属性】
技术研发人员:吴艳虞雁群刘彦伸郭银锋
申请(专利权)人:浙江御安信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1