一种安全威胁信息分层提取的方法及装置制造方法及图纸

技术编号:35174212 阅读:18 留言:0更新日期:2022-10-12 17:40
本申请公开了一种安全威胁信息分层提取的方法及装置,可应用于自然语言处理领域和信息安全领域。该方法包括:读取安全威胁信息;当所述安全威胁信息中存在符合关系指标的第一词语时,定位所述第一词语的位置区域;预测所述第一词语的关系类型;当所述关系类型与关系类型集对应时,扫描所述位置区域内所有的第二词语;所述关系类型集包括至少一个关系类型;根据所述第二词语预测所述第一词语对应的实体类型。如此,通过先确定安全威胁信息中的关系类型,然后利用实体类型与关系类型之间的关系预测该关系类型对应的实体类型,从而解决了现有技术智能决策推演精确度低的问题。现有技术智能决策推演精确度低的问题。现有技术智能决策推演精确度低的问题。

【技术实现步骤摘要】
一种安全威胁信息分层提取的方法及装置


[0001]本申请涉及自然语言处理领域和信息安全领域,尤其涉及一种安全威胁信息分层提取的方法及装置。

技术介绍

[0002]随着人们对于网络的开发,使得网络的应用领域越来越广泛,对网络的要求也越来越高。其中网络的安全性自始至终都是最重要的,而网络安全威胁信息则来源于以往对于网络安全威胁的研究、归纳与总结。
[0003]由于攻击者在攻击时间,攻击准备,可用资源方面都拥有极大的优势,因此从攻击者采取攻击措施开始,到被攻击者发现并对攻击进行回应,这之间被称为攻击者的“自由攻击阶段”。而分析网络威胁安全信息的价值,就在于可以帮助被攻击者快速准确地对当前局势进行判断,了解当前面对的网络威胁。其中多体现在分析网络威胁安全信息中的关系类型与其对应的实体类型,为防御或回击时提供决策辅助,乃至用于日常监测潜在的网络威胁,使攻击者难以重用攻击方式和攻击工具。现有的对于网络威胁安全信息中的实体类型和关系类型的提取相互独立,难以保证提取精度。
[0004]因此,如何提高智能决策推演的精确度,是本领域技术人员急需解决的问题。

技术实现思路

[0005]基于上述问题,本申请提供了一种安全威胁信息分层提取的方法及装置,通过先确定安全威胁信息中的关系类型,然后利用实体类型与关系类型之间的联系预测该关系类型对应的实体类型,从而解决了现有技术智能决策推演精确度低的问题。
[0006]第一方面,本申请实施例提供了一种安全威胁信息分层提取的方法,包括:读取安全威胁信息;当所述安全威胁信息中存在符合关系指标的第一词语时,定位所述第一词语的位置区域;预测所述第一词语的关系类型;当所述关系类型与关系类型集对应时,扫描所述位置区域内所有的第二词语;所述关系类型集包括至少一个所述关系类型;根据所述第二词语预测所述第一词语对应的实体类型。
[0007]可选的,所述预测所述第一词语的关系类型,包括:利用关系策略函数计算所述第一词语属于各个关系类型的概率;选择概率最高的所述关系类型作为所述第一词语的所述关系类型。
[0008]可选的,所述利用关系策略函数计算所述第一词语属于各个关系类型的概率,包括:获取高层强化学习网络的高层当前时刻状态;将所述高层当前时刻状态输入关系策略函数,使所述关系策略函数计算所述第一
词语属于各个关系类型的概率。
[0009]可选的,所述方法还包括:预测得到的所述关系类型与第一训练集中的关系对应时,向所述高层强化学习网络提供正奖励;预测得到的所述关系类型与所述第一训练集中的所述关系不对应时,向所述高层强化学习网络提供负奖励;预测得到的所述关系类型为无关系时,不向所述高层强化学习网络提供奖励;所述第一训练集为训练所述高层强化学习网络时的关系集合。
[0010]可选的,所述当所述关系类型与关系类型集对应时,扫描所述位置区域内所有的第二词语,包括:当所述关系类型与关系类型集对应时,启动低层强化学习网络;利用所述低层强化学习网络,扫描所述位置区域内所有的第二词语。
[0011]可选的,所述根据所述第二词语预测所述第一词语对应的实体类型,包括:利用所述低层强化学习网络生成所述位置区域内每一个所述第二词语的标签;根据所述标签预测所述第一词语对应的实体类型。
[0012]可选的,所述根据所述标签预测所述第一词语对应的实体类型,包括:利用实体策略函数计算所述标签属于各个实体类型的概率;选择概率最高的所述实体类型作为所述第一词语对应的所述实体类型。
[0013]可选的,所述利用实体策略函数计算所述标签属于各个实体类型的概率,包括:获取所述低层强化学习网络的低层当前时刻状态;将所述低层强化学习网络的所述低层当前时刻状态和所述关系类型输入实体策略函数,使所述实体策略函数计算所述标签属于各个实体类型的概率。
[0014]可选的,所述方法还包括:预测得到的所述实体类型与所述关系类型对应时,向所述低层强化学习网络提供第一即时奖励;预测得到的所述实体类型与所述关系类型不对应时,向所述低层强化学习网络提供第二即时奖励;所述第一即时奖励大于所述第二即时奖励;当预测得到的全部所述实体类型均与第二训练集中的实体对应时,向所述低层强化学习网络提供正奖励;当存在预测得到的所述实体类型与所述第二训练集中的所述实体不对应时,向所述低层强化学习网络提供负奖励;所述第二训练集为训练所述低层强化学习网络时的实体集合。
[0015]第二方面,本申请实施例提供了一种安全威胁信息分层提取的装置,包括:读取模块,用于读取安全威胁信息;定位模块,用于当所述安全威胁信息中存在符合关系指标的第一词语时,定位所述第一词语的位置区域;关系类型预测模块,用于预测所述第一词语的关系类型;扫描模块,用于当所述关系类型与关系类型集对应时,扫描所述位置区域内所有
的第二词语;所述关系类型集包括至少一个所述关系类型;实体类型预测模块,用于根据所述第二词语预测所述第一词语对应的实体类型。
[0016]从以上技术方案可以看出,相较于现有技术,本申请具有以下优点:本申请先读取安全威胁信息,然后判断读取的安全威胁信息中是否存在符合关系指标的第一词语。当判断存在符合关系指标的第一词语之后,定位第一词语的位置区域。然后预测第一词语的关系类型,判断该关系类型是否与预先设定的至少包括一个关系类型的关系类型集对应。当关系类型与关系类型集对应时,扫描该位置区域的所有第二词语。最后根据第二词语预测第一词语对应的实体类型。如此,通过先确定安全威胁信息中的关系类型,然后利用实体类型与关系类型之间的联系预测该关系类型对应的实体类型,从而解决了现有技术智能决策推演精确度低的问题。
附图说明
[0017]图1为本申请实施例提供的一种安全威胁信息分层提取的方法的流程图;图2为本申请实施例提供的一种高层强化学习网络的工作原理流程图;图3为本申请实施例提供的一种低层强化学习网络的工作原理流程图;图4为本申请实施例提供的一种安全威胁信息分层提取的装置的结构示意图。
具体实施方式
[0018]正如前文所述,现有的对于网络威胁安全信息中的实体类型和关系类型的提取相互独立,难以保证提取精度。具体来说,当前技术很多都是先进行实体类型的识别后,再进行关系类型的抽取。关系类型和实体类型的提取相互独立,没有充分的将关系类型和实体类型的联系运用起来,所以可能会出现提取得到的关系类型与提取到的实体类型对应不上的情况,从而难以保证提取精度。
[0019]为了解决上述问题,本申请提供了一种数据清理方法,该方法包括:先读取安全威胁信息,然后判断读取的安全威胁信息中是否存在符合关系指标的第一词语。当判断存在符合关系指标的第一词语之后,定位第一词语的位置区域。然后预测第一词语的关系类型,判断该关系类型是否与预先设定的至少包括一个关系类型的关系类型集对应。当关系类型与关系类型集对应时,扫描该位置区域的所有第二词语。最后根据第二词语预测第一词语对应的实体类型。
[0020]如此,通过先确定安全威胁信息中的关系类型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种安全威胁信息分层提取的方法,其特征在于,所述方法包括:读取安全威胁信息;当所述安全威胁信息中存在符合关系指标的第一词语时,定位所述第一词语的位置区域;预测所述第一词语的关系类型;当所述关系类型与关系类型集对应时,扫描所述位置区域内所有的第二词语;所述关系类型集包括至少一个所述关系类型;根据所述第二词语预测所述第一词语对应的实体类型。2.根据权利要求1所述的方法,其特征在于,所述预测所述第一词语的关系类型,包括:利用关系策略函数计算所述第一词语属于各个关系类型的概率;选择概率最高的所述关系类型作为所述第一词语的所述关系类型。3.根据权利要求2所述的方法,其特征在于,所述利用关系策略函数计算所述第一词语属于各个关系类型的概率,包括:获取高层强化学习网络的高层当前时刻状态;将所述高层当前时刻状态输入关系策略函数,使所述关系策略函数计算所述第一词语属于各个关系类型的概率。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:预测得到的所述关系类型与第一训练集中的关系对应时,向所述高层强化学习网络提供正奖励;预测得到的所述关系类型与所述第一训练集中的所述关系不对应时,向所述高层强化学习网络提供负奖励;预测得到的所述关系类型为无关系时,不向所述高层强化学习网络提供奖励;所述第一训练集为训练所述高层强化学习网络时的关系集合。5.根据权利要求1所述的方法,其特征在于,所述当所述关系类型与关系类型集对应时,扫描所述位置区域内所有的第二词语,包括:当所述关系类型与关系类型集对应时,启动低层强化学习网络;利用所述低层强化学习网络,扫描所述位置区域内所有的第二词语。6.根据权利要求5所述的方法,其特征在于,所述根据所述第二词语预测所述第一词语对应的实体类型,包括:利用所述低层强化学习网络生成所述位置区域内每一...

【专利技术属性】
技术研发人员:黄安付
申请(专利权)人:白杨时代北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1