System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及安全,特别涉及一种生成漏洞类型的方法、装置及电子设备。
技术介绍
1、开源软件中的漏洞很容易被攻击者恶意操作,安全专家必须了解已知的漏洞才能快速应对威胁,美国国家漏洞数据库(nvd)提供了常见的漏洞威胁情报(cve)条目,一条cve条目通常由漏洞描述、漏洞评分系统、参考链接、软件身份标识和漏洞类型(cwe)组成,其中,漏洞类型是对漏洞进行分类的工业标准,在实际漏洞预警与治理中,漏洞类型通常是不可或缺的信息类别。
2、现有技术公开的漏洞数据库中,漏洞类型通常是缺失的,比如,nvd有20多万个cve条目,有57.6%的cve条目没有对应的漏洞类型,同时,对于拥有对应漏洞类型的cve条目,也存在漏洞类型标注不准确的问题。
技术实现思路
1、本专利技术提供一种生成漏洞类型的方法、电子设备及装置,用以解决现有技术中存在漏洞类型通常缺失及标注不准确的问题。
2、本专利技术方法包括:
3、第一方面,本申请实施例提供一种生成漏洞类型的方法,所述方法包括:
4、获取多个漏洞对应的漏洞描述文本和漏洞类型,其中,所述漏洞描述文本包括漏洞后果、漏洞解释以及漏洞相关标题;
5、确定每个漏洞描述文本中的词频特征向量;
6、基于漏洞描述文本中的词频特征向量和所述漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型;
7、将目标漏洞对应的漏洞描述文本中的词频特征向量输入至所述漏洞类型生成模型,将
8、在一种可能的实现方式中,所述确定每个漏洞描述文本中的词频特征向量之后,所述得到漏洞类型生成模型之前,还包括:
9、针对每个漏洞描述文本,基于boruta算法从所述漏洞描述文本中的词频特征向量中选择目标词频特征向量;
10、所述基于漏洞描述文本中的词频特征向量和所述漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型,包括:
11、基于漏洞描述文本中的目标词频特征向量和所述漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型。
12、在一种可能的实现方式中,所述基于漏洞描述文本中的目标词频特征向量和所述漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型,包括:
13、计算每个漏洞类型的先验概率,以及每个目标词频特征向量在每个漏洞类型中的条件概率;
14、将每个漏洞类型和先验概率值的第一对应关系,以及每个目标词频特征向量、每个漏洞类型、条件概率值的第二对应关系,作为所述漏洞类型生成模型。
15、在一种可能的实现方式中,所述将目标漏洞对应的漏洞描述文本中的词频特征向量输入至所述漏洞类型生成模型,将所述漏洞类型生成模型输出的漏洞类型作为所述目标漏洞对应的漏洞类型,还包括:
16、针对所述目标漏洞的漏洞描述文本中的每个词频特征向量,从所述第一对应关系中,确定与漏洞类型对应的先验概率,以及从所述第二对应关系中确定所述词频特征向量在每个漏洞类型中对应的条件概率;
17、基于确定的先验概率和确定的条件概率,计算所述词频特征向量对于每个漏洞类型的后验概率;
18、将计算得到的后验概率中的最大后验概率对应的漏洞类型,作为所述目标漏洞对应的漏洞类型。
19、在一种可能的实现方式中,确定每个漏洞描述文本中的词频特征向量,包括:
20、基于tf-idf算法对每个漏洞描述文本进行文本编码,通过统计每个漏洞描述文本中目标词语的频率,确定每个漏洞描述文本中的词频特征向量。
21、在一种可能的实现方式中,所述获取多个漏洞对应的漏洞描述文本和漏洞类型之后,所述确定每个漏洞描述文本中的词频特征向量之前,还包括:
22、对每个漏洞描述文本进行文本清洗,去除所述漏洞描述文本中的干扰词语。
23、第二方面,本申请实施例提供一种生成漏洞类型的装置,包括:
24、漏洞数据预处理模块,用于获取多个漏洞对应的漏洞描述文本和漏洞类型,其中,所述漏洞描述文本包括漏洞后果、漏洞解释以及漏洞相关标题;
25、漏洞描述文本编码模块,确定每个漏洞描述文本中的词频特征向量;
26、模型训练模块,用于基于漏洞描述文本中的词频特征向量和所述漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型;
27、漏洞类型生成模块,用于将目标漏洞对应的漏洞描述文本中的词频特征向量输入至所述漏洞类型生成模型,将所述漏洞类型生成模型输出的漏洞类型作为所述目标漏洞对应的漏洞类型。
28、在一种可能的实现方式中,还包括:
29、特征选择模块,用于针对每个漏洞描述文本,基于boruta算法从所述漏洞描述文本中的词频特征向量中选择目标词频特征向量。
30、在一种可能的实现方式中,所述模型训练模块具体用于:
31、基于漏洞描述文本中的目标词频特征向量和所述漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型。
32、第三方面,本申请提供一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中:
33、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面任一所述的方法。
34、本专利技术有益效果如下:
35、本申请实施例提供的一种生成漏洞类型的方法、装置及电子设备,该方法包括:获取多个漏洞对应的漏洞描述文本和漏洞类型,其中,漏洞描述文本包括漏洞后果、漏洞解释以及漏洞相关标题;确定每个漏洞描述文本中的词频特征向量;基于漏洞描述文本中的词频特征向量和漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型;将目标漏洞对应的漏洞描述文本中的词频特征向量输入至漏洞类型生成模型,将漏洞类型生成模型输出的漏洞类型作为目标漏洞对应的漏洞类型。本申请实施例,基于机器学习,获取多个漏洞对应的漏洞描述文本和漏洞类型,通过确定每个漏洞描述文本中的词频特征向量,并基于漏洞描述文本中的词频特征向量和漏洞描述文本对应的漏洞类型进行朴素贝叶斯模型训练,构建了漏洞描述文本与漏洞类型的对应关系,得到漏洞类型生成模型,以实现更加高效地查询漏洞类型。
本文档来自技高网...【技术保护点】
1.一种生成漏洞类型的方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述确定每个漏洞描述文本中的词频特征向量之后,所述得到漏洞类型生成模型之前,还包括:
3.如权利要求2所述的方法,其特征在于,所述基于漏洞描述文本中的目标词频特征向量和所述漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型,包括:
4.如权利要求3所述的方法,其特征在于,所述将目标漏洞对应的漏洞描述文本中的词频特征向量输入至所述漏洞类型生成模型,将所述漏洞类型生成模型输出的漏洞类型作为所述目标漏洞对应的漏洞类型,还包括:
5.如权利要求1所述的方法,其特征在于,确定每个漏洞描述文本中的词频特征向量,包括:
6.如权利要求1~4任一所述的方法,其特征在于,所述获取多个漏洞对应的漏洞描述文本和漏洞类型之后,所述确定每个漏洞描述文本中的词频特征向量之前,还包括:
7.一种生成漏洞类型的装置,其特征在于,包括:
8.如权利要求7所述的装置,其特征在于,还包括:
9.如权利要求
10.一种电子设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中:
...【技术特征摘要】
1.一种生成漏洞类型的方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述确定每个漏洞描述文本中的词频特征向量之后,所述得到漏洞类型生成模型之前,还包括:
3.如权利要求2所述的方法,其特征在于,所述基于漏洞描述文本中的目标词频特征向量和所述漏洞描述文本对应的漏洞类型,对朴素贝叶斯模型进行训练,得到漏洞类型生成模型,包括:
4.如权利要求3所述的方法,其特征在于,所述将目标漏洞对应的漏洞描述文本中的词频特征向量输入至所述漏洞类型生成模型,将所述漏洞类型生成模型输出的漏洞类型作为所述目标漏洞对应的漏洞类型,还包括:<...
【专利技术属性】
技术研发人员:郭庆,管伟,许翠娜,付震,颜筱威,
申请(专利权)人:天翼安全科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。