基于融合图谱的预测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26304611 阅读:28 留言:0更新日期:2020-11-10 20:00
本发明专利技术实施例提供了一种基于融合图谱的预测方法、装置、电子设备及存储介质,用以解决现有单一图谱表示网络空间情报信息的静态性和不充分性,以及目标行为分析预测结果不准确的问题。该方法包括:对网络安全空间情报数据进行预处理;抽取预处理后的情报数据中的实体、关系及属性,构建知识图谱;抽取网络安全空间情报数据中的安全事件,构建事理图谱;通过实体链接技术与图谱推理技术,构建知识图谱与事理图谱的融合图谱;基于所述融合图谱对新的情报数据进行最终行为预测。

【技术实现步骤摘要】
基于融合图谱的预测方法、装置、电子设备及存储介质
本专利技术涉及网络安全
,尤其涉及一种基于融合图谱的预测方法、装置、电子设备及存储介质。
技术介绍
网络空间目标行为的准确预测无论对于军事方面还是民用方面都具有十分重要的作用,能够帮助网络管理人员及时准确掌握网络所处的安全现状,并对网络系统的资源及安全设施做出合理的配置。为了应对日益错综复杂的网络行为,预测技术也在不断演变。知识图谱作为一种成熟的技术被很多学者应用到网络空间行为预测领域,事理图谱作为一种新兴技术也不断被领域内的专家所应用。知识图谱主要有实体属性和关系以及实体上下位信息等知识形式,事理图谱是一种以事件为节点的新型图谱,描述了事件之间顺承、因果等事件关系,以及事件转移概率等信息,能够刻画事件之间演化规律的可能性,相比知识图谱,事理图谱更符合人类对事情发展和行为执行的认知规律。目前,基于知识图谱和事理图谱的网络空间目标行为预测技术的研究取得了一定的成果和进展,但尚有很多需要研究和改进的地方。主要有三点:1、知识图谱中本体所使用的概念模型缺乏对安全事件之间的演化规律和模式知识的挖掘,进而难以反映行为逻辑之间更高层次和更复杂的语义信息。现有基于知识图谱的目标行为推演技术大多缺乏行为动态描述,行为推演过程一般具有静态性和不充分性。2、目前对融合图谱的挖掘深度不够,能够进行网络空间目标行为预测的图谱推理技术都不是很成熟,建立的模型和使用的算法尚不成体系。3、事理图谱中事理逻辑都是事件与事件之间的关系,缺乏已知目标行为的多步动作,预测目标行为的事理逻辑表示方法,这限制了对目标行为推理过程的预测实现。由于网络空间领域情报信息数量大且关系复杂,需要知识图谱和事理图谱对情报进行梳理和归纳,所以亟需将两种图谱融合后的相关知识应用于网络空间行为预测领域。
技术实现思路
本专利技术实施例提供了一种基于融合图谱的预测方法、装置、电子设备及存储介质,用以解决现有单一图谱表示网络空间情报信息的静态性和不充分性,以及目标行为分析预测结果不准确的问题。基于上述问题,本专利技术实施例提供的一种基于融合图谱的预测方法,包括:对网络安全空间情报数据进行预处理;抽取预处理后的情报数据中的实体、关系及属性,构建知识图谱;抽取网络安全空间情报数据中的安全事件,构建事理图谱;通过实体链接技术与图谱推理技术,构建知识图谱与事理图谱的融合图谱;基于所述融合图谱对新的情报数据进行最终行为预测。进一步地,抽取情报数据中的安全事件,构建事理图谱,具体为:抽取的情报数据中的安全事件;对安全事件的时序信息、空间信息及事理逻辑进行关联分析;对关联事件进行消歧和/或融合处理;对经过关联分析、消歧和/或融合处理后的安全事件,抽取关键动作行为,事件及事件发生的属性信息,构建事理图谱;所述属性信息包括安全事件发生时间、发生地点和发起人。进一步地,基于所述融合图谱对新的情报数据进行最终行为预测,具体为:获取新的情报数据,并抽取情报数据的关键目标及关键动作行为;基于所述融合图谱,对新的情报数据的关键目标做属性预测,根据预测的关键目标的属性,与所述融合图谱中相同属性的不同事件进行关联,预测的情报数据的关键目标行为的行为规律B1;遍历所述融合图谱中关键动作行为,计算融合图谱中关键动作行为关键词的词向量与抽取的新的情报数据的关键动作行为关键词的词向量的相似度;相似度高的融合图谱中的关键动作行为的后续行为,即为新的情报数据的关键目标行为可能的后续行为B2;根据行为规律B1和可能的后续行为B2,分析行为发生的可能性,得到新的情报数据最终行为的预测结果。进一步地,词向量间的相似度计算采用公式(1):其中,sim(Di,Sj)表示向量s1中第i个词语与向量s2中第j个词语之间的相似度,表示最相似的m个词对的相似度之和,m表示向量s1中词语个数,n表示向量s2中词语个数;而向量中词语元素的相似度计算采用公式(2):其中,sim(w1,w2)表示词语w1和w2的相似度,vecl1是词语w1特定语义的词向量表示,vecl2是词语w2特定语义的词向量表示。本专利技术实施例提供的一种基于融合图谱的预测装置,包括:预处理模块:用于对网络安全空间情报数据进行预处理;知识图谱构建模块:用于抽取预处理后的情报数据中的实体、关系及属性,构建知识图谱;事理图谱构建模块:用于抽取网络安全空间情报数据中的安全事件,构建事理图谱;融合图谱构建模块:用于通过实体链接技术与图谱推理技术,构建知识图谱与事理图谱的融合图谱;预测模块:用于基于所述融合图谱对新的情报数据进行最终行为预测。进一步地,所述事理图谱构建模块还包括:抽取模块一:用于抽取的情报数据中的安全事件;分析模块:用于对安全事件的时序信息、空间信息及事理逻辑进行关联分析;处理模块:用于对关联事件进行消歧和/或融合处理;抽取模块二:用于对经过关联分析、消歧和/或融合处理后的安全事件,抽取关键动作行为,事件及事件发生的属性信息,构建事理图谱;所述属性信息包括安全事件发生时间、发生地点和发起人。进一步地,所述预测模块还包括:抽取模块三:用于获取新的情报数据,并抽取情报数据的关键目标及关键动作行为;预测模块一:用于基于所述融合图谱,对新的情报数据的关键目标做属性预测,根据预测的关键目标的属性,与所述融合图谱中相同属性的不同事件进行关联,预测的情报数据的关键目标行为的行为规律B1;相似度计算模块:用于遍历所述融合图谱中关键动作行为,计算融合图谱中关键动作行为关键词的词向量与抽取的新的情报数据的关键动作行为关键词的词向量的相似度;相似度高的融合图谱中的关键动作行为的后续行为,即为新的情报数据的关键目标行为可能的后续行为B2;预测模块二:用于根据行为规律B1和可能的后续行为B2,分析行为发生的可能性,得到新的情报数据最终行为的预测结果。进一步地,相似度计算模块中,词向量间的相似度计算采用公式(1):其中,sim(Di,Sj)表示向量s1中第i个词语与向量s2中第j个词语之间的相似度,表示最相似的m个词对的相似度之和,m表示向量s1中词语个数,n表示向量s2中词语个数;而向量中词语元素的相似度计算采用公式(2):其中,sim(w1,w2)表示词语w1和w2的相似度,vecl1是词语w1特定语义的词向量表示,vecl2是词语w2特定语义的词向量表示。本专利技术实施例同时公开一种基于融合图谱的预测的电子设备,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行任一前述的基于融合图谱的预测方法。本专利技术实施例提供了计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执本文档来自技高网
...

【技术保护点】
1.一种基于融合图谱的预测方法,其特征在于,包括:/n对网络安全空间情报数据进行预处理;/n抽取预处理后的情报数据中的实体、关系及属性,构建知识图谱;/n抽取网络安全空间情报数据中的安全事件,构建事理图谱;/n通过实体链接技术与图谱推理技术,构建知识图谱与事理图谱的融合图谱;/n基于所述融合图谱对新的情报数据进行最终行为预测。/n

【技术特征摘要】
1.一种基于融合图谱的预测方法,其特征在于,包括:
对网络安全空间情报数据进行预处理;
抽取预处理后的情报数据中的实体、关系及属性,构建知识图谱;
抽取网络安全空间情报数据中的安全事件,构建事理图谱;
通过实体链接技术与图谱推理技术,构建知识图谱与事理图谱的融合图谱;
基于所述融合图谱对新的情报数据进行最终行为预测。


2.如权利要求1所述的方法,其特征在于,抽取情报数据中的安全事件,构建事理图谱,具体为:
抽取的情报数据中的安全事件;
对安全事件的时序信息、空间信息及事理逻辑进行关联分析;
对关联事件进行消歧和/或融合处理;
对经过关联分析、消歧和/或融合处理后的安全事件,抽取关键动作行为,事件及事件发生的属性信息,构建事理图谱;
所述属性信息包括安全事件发生时间、发生地点和发起人。


3.如权利要求2所述的方法,其特征在于,基于所述融合图谱对新的情报数据进行最终行为预测,具体为:
获取新的情报数据,并抽取情报数据的关键目标及关键动作行为;
基于所述融合图谱,对新的情报数据的关键目标做属性预测,根据预测的关键目标的属性,与所述融合图谱中相同属性的不同事件进行关联,预测的情报数据的关键目标行为的行为规律B1;
遍历所述融合图谱中关键动作行为,计算融合图谱中关键动作行为关键词的词向量与抽取的新的情报数据的关键动作行为关键词的词向量的相似度;
相似度高的融合图谱中的关键动作行为的后续行为,即为新的情报数据的关键目标行为可能的后续行为B2;
根据行为规律B1和可能的后续行为B2,分析行为发生的可能性,得到新的情报数据最终行为的预测结果。


4.如权利要求3所述的方法,其特征在于,词向量间的相似度计算采用公式(1):



其中,sim(Di,Sj)表示向量s1中第i个词语与向量s2中第j个词语之间的相似度,表示最相似的m个词对的相似度之和,m表示向量s1中词语个数,n表示向量s2中词语个数;
而向量中词语元素的相似度计算采用公式(2):



其中,sim(w1,w2)表示词语w1和w2的相似度,vecl1是词语w1特定语义的词向量表示,vecl2是词语w2特定语义的词向量表示。


5.一种基于融合图谱的预测装置,其特征在于,包括:
预处理模块:用于对网络安全空间情报数据进行预处理;
知识图谱构建模块:用于抽取预处理后的情报数据中的实体、关系及属性,构建知识图谱;
事理图谱构建模块:用于抽取网络安全空间情报数据中的安全事件,构建事理图谱;
融合图谱构建模块:用于通过实体链接技术与图谱推理技术,构建知识图谱与事理图谱的融合图谱;
预测...

【专利技术属性】
技术研发人员:赵静赵超肖新光
申请(专利权)人:哈尔滨安天科技集团股份有限公司
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1