多源异构安全设备海量数据归一化处理方法技术

技术编号：34488749 阅读：82 留言：0更新日期：2022-08-10 09:06

本发明专利技术公布了多源异构安全设备海量数据归一化处理方法，所述海量数据归一化处理方法包含四个步骤：S1：进行数据抽取，从安全设备系统的数据库中抽取数据，建立数据表，将各个设备用唯一标示符进行表示，S2：进行数据转换，采用Z

全部详细技术资料下载

【技术实现步骤摘要】
多源异构安全设备海量数据归一化处理方法

[0001]本专利技术涉及网络安全领域，尤其涉及的是多源异构安全设备海量数据归一化处理方法。

技术介绍

[0002]随着数字化技术的飞速发展，网络已经成为社会发展的重要保证，敏感信息，甚至是一些机密信息会吸引来各种人为攻击(例如信息泄露、信息窃取、数据篡改、数据删添、计算机病毒等)，因此，政府、企业均通过采购相应的网络安全设备部署在各自局域网的边界用于阻断外部的攻击行为，网络安全设备从最早的防火墙的单一的访问控制功能，发展到具备入侵检测、入侵防御及未知威胁感知的多厂家多类型的安全产品的爆发式增长，网络安全设备在攻击行为检测和攻击行为阻断起到至关重要的作用。
[0003]但是，随着网络安全设备类型向着异构多元化方向的不断发展，产生的安全告警数据众多，安全厂家之间针对攻击告警的处置标准和处置方式不一，导致安全产品的告警展示不统一，攻击监测数据分散在不同的安全设备中，多源异构安全设备的海量数据虽然有较大的应用价值，但由于告警存储格式不一致、数据量庞大、数据分散及数据异构等问题，无法很好的指导攻击处置工作，现有技术针对多源异构安全设备的告警日志数据归一化处理有待进一步提高。
[0004]因此，本专利技术提供一种新的方案来解决此问题。

技术实现思路

[0005]针对现有技术存在的不足，本专利技术所要解决的技术问题是针对多源异构安全设备的告警日志数据，提出一种表现更好的数据预处理归一化处理方法，本专利技术提出的海量数据归一化处理方法，使用在分类和聚类算法中表...

【技术保护点】

【技术特征摘要】
1.多源异构安全设备海量数据归一化处理方法，其特征在于，所述海量数据归一化处理方法包含四个步骤：S1：进行数据抽取，从安全设备系统的数据库中抽取数据，建立数据表，将各个设备用唯一标示符进行表示；S2：进行数据转换，采用Z
‑
score标准化方法进行数据的标准化处理；S3：进行数据清洗，对数据的一致性进行检查、修正错误数据与无效数据、填补缺失数据，进行数据质量分层；S4：进行数据装载，将历经数据转换、数据清洗过程之后的数据集加载到目标数据仓库中，处理海量数据的批量装载。2.如权利要求1所述的多源异构安全设备海量数据归一化处理方法，其特征在于，所述步骤S1：进行数据抽取，具体包含以下内容：安全设备的告警分类各不相同，安全设备的类型包括防火墙、IPS、IDS、WAF和流量监控设备，在安全设备中，定义攻击源、受影响IP地址、攻击行为、攻击类型，记录攻击特征，从安全设备系统的数据库中抽取数据，根据需求建立数据表；设一个安全设备的类型为安全设备类型一，安全设备类型一出现告警信息、告警描述，建立一个以安全设备类型一为主键的表，涉及攻击IP、攻击名称、攻击数量的数据仓库，根据仓库进行统计分析，对于同一个设备X，设定设备X的设备名称在防火墙中表示为1X，在入侵防御中表示为2X，在入侵检测中表示为3X，在WEB应用防火墙中表示为4X，将各个设备用唯一标示符进行表示；所述IPS为入侵防御系统，所述IDS为入侵检测系统，所述WAF为Web应用防护系统。3.如权利要求1所述的多源异构安全设备海量数据归一化处理方法，其特征在于，所述S2：进行数据转换，具体包含以下内容：所述数据转换对数据进行格式、名称的统一和数据重新组合，首先将数据标准化，利用标准化后的数据进行数据分析，数据标准化也就是统计数据的指数化，数据标准化处理包括数据同趋化处理和无量纲化处理两个方...

【专利技术属性】
技术研发人员：闫丽景，党芳芳，李帅，岳纲毅，李丁丁，宋一凡，李文萃，刘晗，梁慧超，
申请(专利权)人：国家电网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人