一种基于文本处理的网络安全事件可视化方法技术

技术编号：21432202 阅读：34 留言：0更新日期：2019-06-22 11:55

本发明专利技术公开了一种基于文本处理的网络安全事件可视化方法，其步骤包括：1)获取多个网络安全事件生成一事件集合，并将其转化为一结构化特征向量；2)对每一网络安全事件进行分类标注；3)将每一网络安全事件中的分词按设定的抽取目标进行注释，然后根据注释抽取各网络安全事件的安全事件内容；4)根据每一网络安全事件的安全事件内容，构建出一基础FP树，从该基础FP树中获得条件模式基，利用该条件模式基，再构建一个新的条件FP树，直至新的条件FP树中仅包含一个元素项，得到该网络安全事件的关联频繁集；5)根据关联频繁集，确定对应网络安全事件的关联度强弱以及各网络安全事件之间的连接关系，对该事件集合进行可视化。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本处理的网络安全事件可视化方法
本专利技术属于网络安全
，更进一步涉及一种基于文本处理的网络安全事件可视化方法。本专利技术主要用来实现安全事件语义关联关系模型的建立，揭示安全事件连锁反应机理，为提出安全事件描述框架及度量指标体系奠定基础。所述模型可适用于不断更新的网络安全事件的及时处理与响应，也对攻防技术发展趋势分析与预测有极其积极的意义。
技术介绍
对网络安全(NetworkSecurity)的评估与度量指的是提取一定时间、一定空间内的网络安全相关的要素进行分析，针对安全数据进行综合处理，确定系统受到的攻击行为，提供网络安全的整体情况，进而评估网络系统安全状态，并基于分析结果预测其未来的发展趋势。随着计算机技术和通信技术的迅速发展以及用户需求的不断增加，计算机网络规模日益庞大，应用系统日益复杂。网络安全威胁的范围和内容不断扩大和演化，网络安全形势与挑战日益严峻复杂。如何全方位感知网络安全态势、实时监控网络运行状况、保障信息资产安全，应该引起我们足够的重视。因此，针对网络安全评估模型及关键技术已经成为目前网络安全领域的研究热点。由于网络安全事件层出不穷，针对于安全事件的防御技术和网络攻击危害的预测具有十分重要的意义。网络安全事件可以反映出的技术和危害之间存在的内在关联。网络安全事件带来的危害，对人们的各方面的生活造成不同程度的影响。道高一尺，魔高一丈，安全事件带来危害的同时，也激励着技术的进一步发展，不断出现的新技术或新方法来应对各种网络攻击带来的危害。通过对目前安全事件研究现状的分析，可以得出现在的安全事件分析方法存在以下三点不足：(1)...

【技术保护点】
1.一种基于文本处理的网络安全事件可视化方法，其步骤包括：1)获取多个网络安全事件生成一事件集合，并将该事件集合转化为一结构化特征向量；2)对每一所述网络安全事件进行分类标注；3)将每一网络安全事件中的分词按设定的抽取目标进行注释，然后根据注释抽取各网络安全事件的安全事件内容；4)根据每一网络安全事件的安全事件内容，构建出该网络安全事件的基础FP树，从该基础FP树中获得条件模式基，利用该条件模式基，再构建一个新的条件FP树，然后判断当前新的条件FP树中是否仅包含一个元素项，如果不是，则从当前新的条件FP树中获得条件模式基，利用条件模式基，再构建一个新的条件FP树，直到新的条件FP树包含一个元素项为止；得到该网络安全事件的关联频繁集；5)根据网络安全事件的关联频繁集，确定对应网络安全事件的关联度强弱以及各网络安全事件之间的连接关系，对该事件集合进行可视化。

【技术特征摘要】
1.一种基于文本处理的网络安全事件可视化方法，其步骤包括：1)获取多个网络安全事件生成一事件集合，并将该事件集合转化为一结构化特征向量；2)对每一所述网络安全事件进行分类标注；3)将每一网络安全事件中的分词按设定的抽取目标进行注释，然后根据注释抽取各网络安全事件的安全事件内容；4)根据每一网络安全事件的安全事件内容，构建出该网络安全事件的基础FP树，从该基础FP树中获得条件模式基，利用该条件模式基，再构建一个新的条件FP树，然后判断当前新的条件FP树中是否仅包含一个元素项，如果不是，则从当前新的条件FP树中获得条件模式基，利用条件模式基，再构建一个新的条件FP树，直到新的条件FP树包含一个元素项为止；得到该网络安全事件的关联频繁集；5)根据网络安全事件的关联频繁集，确定对应网络安全事件的关联度强弱以及各网络安全事件之间的连接关系，对该事件集合进行可视化。2.如权利要求1所述的方法，其特征在于，生成所述结构化特征向量的方法为：首先对每一所述网络安全事件进行分词，然后计算每一分词的TF/IDF权值，将分词TF/IDF权值大于设定阈值的分词作为特征词；然后对选出的各特征词设置编号并依据编号将各个特征词的TF/IDF权值按行写入矩阵，得到所述结构化特征向量；其中，每一网络安全事件对应一段描述该网络安全事件的文字信息。3.如权利要求2所述的方法，其特征在于，利用分类模型对每一所述网络安全事件进行分类标注，其方法为：首先使用梯度下降算法在代价函数的参数空间中搜索所述结构化特征向量中不同特征TF/IDF权值的最优解，然后根据特征的TF/IDF权值及其最优解利用反向传播算法来计算权值导数，用于计算特征与类别间联合概率分布；然后对于每一待标注的网络安全事件，依据各特征与类别间联合概率分布，分别计算在输入该待标注网络安全事件的特征时，该待标注网络安全事件属于每个类别的后验概率，将具有最大后验概率的类别k作为...

【专利技术属性】
技术研发人员：姬逸潇，张玉清，
申请(专利权)人：西安电子科技大学，中国科学院大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人