一种面向多源漏洞信息的事件图谱自动构建方法及系统技术方案

技术编号：30823606 阅读：32 留言：0更新日期：2021-11-18 12:13

本发明专利技术提出了一种面向多源漏洞信息的事件图谱自动构建方法及系统，从文本和代码信息两个角度将CVE、NVD等网站中的漏洞相关信息进行整合。首先从漏洞数据库中爬取漏洞报告，将漏洞的发生原因视为事件触发词进行识别，并通过其判断漏洞类型。其次通过命名实体识别的方式对描述中的攻击者、后果、位置等信息进行识别，并进行信息补全。再利用文本信息抽取显式的事件关系，并利用文本相似性抽取隐式的事件关系，并进行漏洞相关代码的表征。最终借助可视化工具将所得的漏洞事件信息可视化为事件图谱，从而为开发人员提供更直观准确的漏洞事件及其相关因素，减少开发人员手动分析和理解漏洞数据的人力和时间成本，提高软件维护的有效性和高效性。效性和高效性。效性和高效性。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向多源漏洞信息的事件图谱自动构建方法及系统

[0001]本专利技术属于软件安全领域，特别涉及一种面向多源漏洞信息的事件图谱自动构建方法及系统。

技术介绍

[0002]随着大数据时代的到来，高质量的数据集成为了科学研究的重要基石，因此，漏洞研究的成败也与漏洞数据集质量的好坏息息相关。现存多个漏洞数据集，但缺少数据集规范，导致信息内容杂乱、信息种类缺失等问题。因此需要自动化构建一个规整、规范、可用性较强的漏洞事件图谱，涵盖多个数据源的漏洞发生信息，将原本杂乱的信息转化为规整的知识，以便于开发人员直观地对漏洞进行理解、分析和使用，减少了漏洞数据集构建的人力资本，也便于支撑后期的漏洞分析及诊断。
[0003]事件知识图谱从自然语言文本中抽取事件和实体、属性、关系等进行知识融合，然后通过本体构建体系框架，以结构化的三元组形式存储。目前已有一些工作构建事件图谱，如文献《Building event
‑
centric knowledge graphs from news》提出了一种以事件为中...

【技术保护点】

【技术特征摘要】
1.一种面向多源漏洞信息的事件图谱自动构建方法，其特征在于，所述方法包括以下步骤：步骤1，根据CVE
‑
ID从漏洞数据库中爬取漏洞报告，构建漏洞报告数据集；步骤2，将漏洞的发生原因视为事件触发词，构建漏洞事件触发词标注集，进行漏洞事件的触发词提取，并通过触发词判断漏洞类型；步骤3，通过命名实体识别的方式从漏洞的描述信息中提取漏洞事件元素，并进行信息补全；步骤4，利用文本信息抽取显式的漏洞事件关系，并利用文本相似性抽取隐式的漏洞事件关系；步骤5，进行漏洞相关代码的表征；步骤6，将步骤2至步骤5所得的漏洞事件信息可视化为漏洞事件图谱；所述图谱中包括漏洞事件的相关元素，漏洞事件之间的关系，漏洞事件通过事件触发词关联漏洞类型。2.根据权利要求1所述的面向多源漏洞信息的事件图谱自动构建方法，其特征在于，所述步骤1中根据CVE
‑
ID采集漏洞数据库CVE、NVD和IBM X
‑
Force Exchange中的漏洞报告；获取报告中的描述信息、发布日期、CVSS分值、CWE类别以及相关链接，以此得到漏洞报告数据集。3.根据权利要求1所述的面向多源漏洞信息的事件图谱自动构建方法，其特征在于，所述步骤2中利用漏洞事件触发词标注集，训练BERT模型的序列标注任务，并利用训练后的模型进行触发词提取；利用softmax分类器将提取的触发词进行分类，漏洞类型包括时序漏洞、配置漏洞、输入验证漏洞、内存漏洞、逻辑资源漏洞、数字漏洞、未知漏洞中的一种或多种。4.根据权利要求2所述的面向多源漏洞信息的事件图谱自动构建方法，其特征在于，所述步骤3中提取的漏洞事件中的事件元素包括触发操作、发生情境、攻击者、影响版本、后果和位置；利用构建的漏洞事件元素标注集，训练BERT模型的序列标注任务，并利用训练后的模型连接BiLSTM层和CRF层进行事件元素提取。5.根据权利要求2所述的面向多源漏洞信息的事件图谱自动构建方法，其特征在于，所...

【专利技术属性】
技术研发人员：魏颖，孙小兵，薄莉莉，李斌，程星琪，
申请(专利权)人：扬州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人