一种基于漏洞平台的漏洞分类统计系统及方法技术方案

技术编号:19858567 阅读:20 留言:0更新日期:2018-12-22 11:56
本发明专利技术公开了一种基于漏洞平台的漏洞分类统计方法,该统计方法包括:用编写的脚本获取选定平台上的漏洞数据;采用特征关键词提取技术对所述漏洞数据进行数据特征提取;利用机器学习和自然语言处理技术建立自动分类模型;采用所述自动分类模型对所述数据特征进行分类,得到不同的漏洞类型;根据不同漏洞类型的出现情况对各地区不同组织的漏洞分布进行统计分析。该发明专利技术能针对性地分析出不同漏洞类型的出现状况,能对不同地区、不同组织以及不同时间内的漏洞进行清楚的分类统计,提高漏洞归档效率。

【技术实现步骤摘要】
一种基于漏洞平台的漏洞分类统计系统及方法
本专利技术涉及电子信息领域
,特别是一种基于漏洞平台的漏洞分类统计系统及方法。
技术介绍
随着信息技术的不断发展,人类社会的信息化程度越来越高,整个社会对网络信息的依赖程度也越来越高,从而网络安全的重要性也越来越高。目前各种对网络安全造成威胁的攻击也越来越多,例如,漏洞攻击。漏洞是在硬件、软件、协议的具体实现或系统安全策略上存在的缺陷,从而可以使攻击者能够在未授权的情况下访问或破坏系统。目前,很多行政机构、企业网站都使用第三方建站系统,这些第三方建站系统时不时被发现网站有漏洞。目前,为保护网络用户的信息安全,各网站都采用一个专门的中心机构进行安全漏洞的统一维护,即人工来收集安全问题、组织专人进行漏洞问题核实和验证、进行漏洞归档等,但是,这些维护工作需要耗费大量的人力和时间,无法对不同地区、不同组织以及不同时间内的漏洞进行清楚的分类统计。
技术实现思路
本专利技术的目的是提供了一种基于漏洞平台的漏洞分类统计系统及方法,能针对性地分析出不同漏洞类型的出现状况,能对不同地区、不同组织以及不同时间内的漏洞进行清楚的分类统计,提高漏洞归档效率。为实现上述目的,本专利技术提供了如下方案:一种基于漏洞平台的漏洞分类统计方法,包括:获取在选定平台上编写的爬虫脚本爬取的漏洞数据;采用特征关键词提取技术对所述漏洞数据进行数据特征提取;利用机器学习和自然语言处理技术建立自动分类模型;采用所述自动分类模型对所述数据特征进行分类,得到不同的漏洞类型;根据不同漏洞类型的出现情况对各地区不同组织的漏洞分布进行统计分析。所述采用特征关键词提取技术对所述漏洞数据进行数据特征提取,具体包括:对所述漏洞数据根据标题进行初步分类;删除每类漏洞数据中指定的中文停止词;计算去除中文停止词的漏洞数据中每个词的词频-逆文档频率值;提取每类漏洞数据中词频-逆文档频率值按照从高至低顺序排列的前250个词;对每类漏洞数据的前250个词中的重复词进行合并和删除;将所述重复词作为数据特征。所述用编写的脚本获取选定平台上的漏洞数据,具体包括:在众多漏洞平台中选择出漏洞平台;所述选择的漏洞平台为提交漏洞总数和漏洞种类总数综合最多的平台;收集白帽子安全人员提交到所述漏洞平台的漏洞数据;针对选择的不同的漏洞平台编写相应的爬虫脚本;采用所述爬虫脚本从收集到的漏洞数据中爬取相应漏洞数据。所述根据不同漏洞类型的出现情况对各地区不同组织的漏洞分布进行统计分析,具体包括:根据不同类型的漏洞所占的百分比分析不同年份的漏洞数量的变化趋势;根据不同年份收集到的不同单位的漏洞类型总数,判断漏洞类型与各个单位之间的关系;根据各漏洞类型的提交时间,判断各组织对不同漏洞类型的反应能力;根据不同地区提交的漏洞类型的数量,判断各地区提供漏洞类型的变化趋势;根据白帽子安全人员提供的漏洞类型所占的百分比,判断某一漏洞类型数量与相应白帽子安全人员的数量的关系以及各个白帽子安全人员提供不同漏洞类型量的变化趋势。所述各组织包括上市公司、政府机构、创业公司以及教育机构。一种基于漏洞平台的漏洞分类统计系统,包括:数据获取模块,用于获取在选定平台上编写的爬虫脚本爬取的漏洞数据;数据特征提取模块,用于采用特征关键词提取技术对所述漏洞数据进行数据特征提取;自动分类模型建立模块,用于利用机器学习和自然语言处理技术建立自动分类模型;分类模块,用于采用所述自动分类模型对所述数据特征进行分类,得到不同的漏洞类型;统计模块,用于根据不同漏洞类型的出现情况对各地区不同组织的漏洞分布进行统计分析。所述数据特征提取模块,具体包括:初步分类单元,用于对所述漏洞数据根据标题进行初步分类;删除单元,用于删除每类漏洞数据中指定的中文停止词;计算单元,用于计算去除中文停止词的漏洞数据中每个词的词频-逆文档频率值;提取单元,用于提取每类漏洞数据中词频-逆文档频率值按照从高至低顺序排列的前250个词;筛选单元,用于对每类漏洞数据的前250个词中的重复词进行合并和删除;数据特征获取单元,用于将所述重复词作为数据特征。所述数据获取模块,具体包括:漏洞平台选择单元,用于在众多漏洞平台中选择出漏洞平台;所述选择的漏洞平台为提交漏洞总数和漏洞种类总数综合最多的平台;漏洞数据收集单元,用于收集白帽子安全人员提交到所述漏洞平台的漏洞数据;爬虫脚本编写单元,用于针对选择的不同的漏洞平台编写相应的爬虫脚本;漏洞数据获取单元,用于采用所述爬虫脚本从收集到的漏洞数据中爬取相应漏洞数据。所述统计模块,具体包括:年份漏洞统计单元,用于根据不同类型的漏洞所占的百分比分析不同年份的漏洞数量的变化趋势;单位漏洞统计单元,用于根据不同年份收集到的不同单位的漏洞类型总数,判断漏洞类型与各个单位之间的关系;组织漏洞统计单元,用于根据各漏洞类型的提交时间,判断各组织对不同漏洞类型的反应能力;地区漏洞统计单元,用于根据不同地区提交的漏洞类型的数量,判断各地区提供漏洞类型的变化趋势;安全人员漏洞统计单元,用于根据白帽子安全人员提供的漏洞类型所占的百分比,判断某一漏洞类型数量与相应白帽子安全人员的数量的关系以及各个白帽子安全人员提供不同漏洞类型量的变化趋势。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术提供了一种基于漏洞平台的漏洞分类统计系统及方法,采用特征关键词提取技术对所述漏洞数据进行数据特征提取,采用自动分类模型对数据特征进行分类,得到不同的漏洞类型;根据不同漏洞类型的出现情况对不同地区、不同组织以及不同时间内的漏洞进行清楚的分类统计,提高漏洞归档效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于漏洞平台的安全分析评估方法的流程示意图;图2为本专利技术基于漏洞平台的安全分析评估系统实施例一的结构示意图;图3为本专利技术基于漏洞平台的安全分析评估系统实施例二的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的目的是提供了一种基于漏洞平台的漏洞分类统计系统及方法,能针对性地分析出不同漏洞类型的出现状况,能对不同地区、不同组织以及不同时间内的漏洞进行清楚的分类统计,提高漏洞归档效率。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1为本专利技术实施例一种基于漏洞平台的安全分析评估方法的方法流程图。如图1所示,一种基于漏洞平台的漏洞分类统计方法,包括:步骤101:获取在选定平台上编写的爬虫脚本爬取的漏洞数据;步骤102:采用TF-IDF技术对所述漏洞数据进行数据特征提取;步骤103:利用机器学习和自然语言处理技术建立自动分类模型;步骤104:采用所述自动分类模型对所述数据特征进行分类,得到不同的漏洞类型;步骤105:根据不同漏洞本文档来自技高网...

【技术保护点】
1.一种基于漏洞平台的漏洞分类统计方法,其特征在于,包括:用编写的脚本获取选定平台上的漏洞数据;采用特征关键词提取技术对所述漏洞数据进行数据特征提取;利用机器学习和自然语言处理技术建立自动分类模型;采用所述自动分类模型对所述数据特征进行分类,得到不同的漏洞类型;根据不同漏洞类型的出现情况对各地区不同组织的漏洞分布进行统计分析。

【技术特征摘要】
1.一种基于漏洞平台的漏洞分类统计方法,其特征在于,包括:用编写的脚本获取选定平台上的漏洞数据;采用特征关键词提取技术对所述漏洞数据进行数据特征提取;利用机器学习和自然语言处理技术建立自动分类模型;采用所述自动分类模型对所述数据特征进行分类,得到不同的漏洞类型;根据不同漏洞类型的出现情况对各地区不同组织的漏洞分布进行统计分析。2.根据权利要求1所述的一种基于漏洞平台的漏洞分类统计方法,其特征在于,所述采用特征关键词提取技术对所述漏洞数据进行数据特征提取,具体包括:对所述漏洞数据根据标题进行初步分类;删除每类漏洞数据中指定的中文停止词;计算去除中文停止词的漏洞数据中每个词的词频-逆文档频率值;提取每类漏洞数据中词频-逆文档频率值按照从高至低顺序排列的前250个词;对每类漏洞数据的前250个词中的重复词进行合并和删除;将所述重复词作为数据特征。3.根据权利要求1所述的一种基于漏洞平台的漏洞分类统计方法,其特征在于,所述用编写的脚本获取选定平台上的漏洞数据,具体包括:在众多漏洞平台中选择出漏洞平台;所述选择的漏洞平台为提交漏洞总数和漏洞种类总数综合最多的平台;收集白帽子安全人员提交到所述漏洞平台的漏洞数据;针对选择的不同的漏洞平台编写相应的爬虫脚本;采用所述爬虫脚本从收集到的漏洞数据中爬取相应漏洞数据。4.根据权利要求1所述的一种基于漏洞平台的漏洞分类统计方法,其特征在于,所述根据不同漏洞类型的出现情况对各地区不同组织的漏洞分布进行统计分析,具体包括:根据不同类型的漏洞所占的百分比分析不同年份的漏洞数量的变化趋势;根据不同年份收集到的不同单位的漏洞类型总数,判断漏洞类型与各个单位之间的关系;根据各漏洞类型的提交时间,判断各组织对不同漏洞类型的反应能力;根据不同地区提交的漏洞类型的数量,判断各地区提供漏洞类型的变化趋势;根据白帽子安全人员提供的漏洞类型所占的百分比,判断某一漏洞类型数量与相应白帽子安全人员的数量的关系以及各个白帽子安全人员提供不同漏洞类型量的变化趋势。5.根据权利要求4所述的一种基于漏洞平台的漏洞分类统计方法,其特征在于,所述各组织包括上市公司、政府机构、创业公司以及教育机构。6.一种基于漏洞平台的漏洞分类统计系统,其特征在于,包括:数据获取模块,用...

【专利技术属性】
技术研发人员:姚茗亮史闻博鲁冰洁刘懿莹何忠郑乾龙
申请(专利权)人:东北大学秦皇岛分校
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1