当前位置: 首页 > 专利查询>广州大学专利>正文

一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法技术

技术编号:43474180 阅读:20 留言:0更新日期:2024-11-27 13:13
本发明专利技术提出一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,该方法基于深度神经网络,采用如下技术方案:(a)使用大规模通用文本数据预训练过的BERT模型对输入文本进行向量编码,得到初步的文本向量表示。通过大规模通用文本数据预训练过的BERT模型,已经获取到了文本的一些潜在语义信息,所以将其对威胁情报文本进行编码得到的向量表示已经包含了丰富的通用先验知识和潜在语义。(b)通过基于注意力的上下文映射方法,缓解了实体语义抽象和实体特征易混淆的问题。(c)通过关系匹配机制来缓解实体之间相关性弱的问题。

【技术实现步骤摘要】

本申请涉及网络安全,且更为具体地,涉及一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法


技术介绍

1、随着网络空间的复杂度越来越高,钓鱼、欺骗、勒索等网络攻击也随之日益增多,且呈现复杂化和多样化的趋势。这对国家和企业的网络空间安全构成了极大地威胁。这些网络空间往往涉及大量的隐私数据甚至国家机密,一旦遭到恶意入侵,且系统无法及时应对,后果将不堪设想。而现有的网络空间防御技术可以分为两部分:1)利用入侵检测技术,当系统检测到网络攻击事件时,及时做出防御来应对攻击。2)根据历史攻击记录,开发和部署新的安全解决方案。然而,攻击者总是会尝试新的攻击技术、攻击策略和恶意软件等,所以导致无法及时更新相关防御策略。

2、而知识图谱因其结构化的存储方式、高效的搜索能力以及简单清楚的可视化形式,使得它非常适合于网络攻击的追踪溯源和潜在威胁挖掘。同时随着大数据技术的爆发,通过挖掘海量的网络威胁情报数据中的威胁信息并构建网络威胁情报知识图谱可作为一种新的网络空间安全解决方案。然而网络威胁情报都是呈现非结构化数据的形式,无法直接存储为知识图谱。所以需要通过本文档来自技高网...

【技术保护点】

1.一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,构建网络威胁情报关系抽取模型的编码层,包括:

3.根据权利要求2所述的一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,构建网络威胁情报关系抽取模型的基于注意力的上下文映射层,包括:

4.根据权利要求3所述的一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,利用预训练的BERT模型对实体和关系标签进行深度编码,以获取富含语义...

【技术特征摘要】

1.一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,构建网络威胁情报关系抽取模型的编码层,包括:

3.根据权利要求2所述的一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,构建网络威胁情报关系抽取模型的基于注意力的上下文映射层,包括:

4.根据权利要求3所述的一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,利用预训练的bert模型对实体和关系标签进行深度编码,以获取富含语义信息的实体标签词嵌入矩阵pe和关系标签词嵌入矩阵pr,用于:获取实体和关系类型词嵌入,将实体标签集el和关系标签集rl输入预训练的bert模型中进行语义编码,得到所述实体标签词嵌入矩阵和所述关系标签词嵌入矩阵公式如下:

5.根据权利要求4所述的一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,以需要识别关系的实体对为整体融合潜在的实体关联信息,增强实体对之间的差异性表示,得到一个新的实体对表示序列ef′,用于:通过随机初始化方法生成初始的头实体跨度尺寸嵌入向量s_h和尾实体跨度尺寸嵌入向量s_t,在多层感知机的多层非线性变换过程中,跨度尺寸信息得以与原始的跨度表示进行深度融合,从而为两个实体生成一个既包含原始文本信息又富含尺寸特征信息的增强型实体表示,其中头实体表示为eh,尾实体表示为et,公式如下:

6.根据权利要求5所述的一种基于注意力上下文映射和关系匹配的网络威胁情报关系抽取方法,其特征在于,将所述关系标签词...

【专利技术属性】
技术研发人员:尚文利王博文周正时昊天李淑琦高晓斌常志伟
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1