一种基于注意力机制的威胁情报关系抽取方法及系统技术方案

技术编号:42480998 阅读:29 留言:0更新日期:2024-08-21 13:01
本发明专利技术涉及威胁情报关系抽取技术领域,具体公开了一种基于注意力机制的威胁情报关系抽取方法及系统,包括:获取关于威胁情报的自然语言文本;基于BERT模型对自然语言文本进行编码,获得多个单词语义表示;基于注意力机制根据多个单词语义表示获得实体语义表示,所述实体语义包括第一实体语义和第二实体语义;根据第一实体语义和第二实体语义获取关系语义表示,本发明专利技术能够解决现有技术中的噪声问题,现有的关系抽取技术中,远程监督会一直存在噪声问题,导致大量的错误标注,通过注意力机制和相似度计算,可以计算句子语义与语句包中每个预设句子的相似度值,并根据相似度值计算包语义表示,从而解决了噪声问题。

【技术实现步骤摘要】

本专利技术涉及威胁情报关系抽取,尤其是一种基于注意力机制的威胁情报关系抽取方法及系统


技术介绍

1、工业互联网威胁情报是指关于工业互联网安全威胁的信息,包括威胁的来源、类型、特征、影响等。通过对工业互联网威胁情报的收集、分析和利用,可以帮助企业及时发现和应对安全威胁,提高工业互联网的安全性和可靠性;工业互联网威胁情报的来源包括网络安全监测、漏洞扫描、攻击检测等多种渠道。通过对这些来源的信息进行分析,可以提取出关于威胁的特征和规律,为企业提供有针对性的安全防护措施。

2、现有的网络威胁情报的关系抽取过程中,远程监督会一直存在噪声问题,远程监督通常基于一组预定义的规则或模式来标注数据,这些规则或模式往往是基于使用者的知识制定的,但使用者的认知和理解往往具有主观性和局限性。因此,这些规则或模式可能无法完全准确地捕捉到所有相关的关系实例,导致标注结果中存在误标或漏标的情况,并且自然语言文本中的语义信息是丰富而复杂的,关系抽取任务需要深入理解文本中的实体和它们之间的关系,而远程监督方法通常只依赖于表面的文本匹配或模式识别,无法完全捕捉文本中的深层语义信本文档来自技高网...

【技术保护点】

1.一种基于注意力机制的威胁情报关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的基于注意力机制的威胁情报关系抽取方法,其特征在于,所述基于BERT模型对自然语言文本进行编码,获得多个单词语义表示的步骤,包括:

3.根据权利要求1所述的基于注意力机制的威胁情报关系抽取方法,其特征在于,所述基于注意力机制根据多个单词语义表示获得实体语义表示的步骤,包括:

4.根据权利要求1所述的基于注意力机制的威胁情报关系抽取方法,其特征在于,所述根据第一实体语义和第二实体语义获取关系语义表示的步骤,包括:

5.根据权利要求1所述的基于注意力机制的威...

【技术特征摘要】

1.一种基于注意力机制的威胁情报关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的基于注意力机制的威胁情报关系抽取方法,其特征在于,所述基于bert模型对自然语言文本进行编码,获得多个单词语义表示的步骤,包括:

3.根据权利要求1所述的基于注意力机制的威胁情报关系抽取方法,其特征在于,所述基于注意力机制根据多个单词语义表示获得实体语义表示的步骤,包括:

4.根据权利要求1所述的基于注意力机制的威胁情报关系抽取方法,其特征在于,所述根据第一实体语义和第二实体语义获取关系语义表示的步骤,包括:

5.根据权利要求1所述的基于注意力机制的威胁情报关系抽取方法,其特征在于,所述根据第一实体语义和第二实体语义获取多个预设句子的步骤,包括...

【专利技术属性】
技术研发人员:何京恒王钢高杰高雲鹏霍闯王影
申请(专利权)人:内蒙古工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1