多源异构安全设备海量数据归一化处理方法技术

技术编号:34488749 阅读:82 留言:0更新日期:2022-08-10 09:06
本发明专利技术公布了多源异构安全设备海量数据归一化处理方法,所述海量数据归一化处理方法包含四个步骤:S1:进行数据抽取,从安全设备系统的数据库中抽取数据,建立数据表,将各个设备用唯一标示符进行表示,S2:进行数据转换,采用Z

【技术实现步骤摘要】
多源异构安全设备海量数据归一化处理方法


[0001]本专利技术涉及网络安全领域,尤其涉及的是多源异构安全设备海量数据归一化处理方法。

技术介绍

[0002]随着数字化技术的飞速发展,网络已经成为社会发展的重要保证,敏感信息,甚至是一些机密信息会吸引来各种人为攻击(例如信息泄露、信息窃取、数据篡改、数据删添、计算机病毒等),因此,政府、企业均通过采购相应的网络安全设备部署在各自局域网的边界用于阻断外部的攻击行为,网络安全设备从最早的防火墙的单一的访问控制功能,发展到具备入侵检测、入侵防御及未知威胁感知的多厂家多类型的安全产品的爆发式增长,网络安全设备在攻击行为检测和攻击行为阻断起到至关重要的作用。
[0003]但是,随着网络安全设备类型向着异构多元化方向的不断发展,产生的安全告警数据众多,安全厂家之间针对攻击告警的处置标准和处置方式不一,导致安全产品的告警展示不统一,攻击监测数据分散在不同的安全设备中,多源异构安全设备的海量数据虽然有较大的应用价值,但由于告警存储格式不一致、数据量庞大、数据分散及数据异构等问题,无法很好的指导攻击处置工作,现有技术针对多源异构安全设备的告警日志数据归一化处理有待进一步提高。
[0004]因此,本专利技术提供一种新的方案来解决此问题。

技术实现思路

[0005]针对现有技术存在的不足,本专利技术所要解决的技术问题是针对多源异构安全设备的告警日志数据,提出一种表现更好的数据预处理归一化处理方法,本专利技术提出的海量数据归一化处理方法,使用在分类和聚类算法中表现更为优秀的Z

score标准化方法来进行数据归一处理,为后续的数据分析打下良好基础,是一种表现更好的数据预处理归一化处理方法。
[0006]其解决的技术方案是,多源异构安全设备海量数据归一化处理方法,所述海量数据归一化处理方法包含四个步骤:
[0007]S1:进行数据抽取,从安全设备系统的数据库中抽取数据,建立数据表,将各个设备用唯一标示符进行表示;
[0008]S2:进行数据转换,采用Z

score标准化方法进行数据的标准化;
[0009]S3:进行数据清洗,对数据的一致性进行检查、修正错误数据与无效数据、填补缺失数据,将数据质量分层;
[0010]S4:进行数据装载,将历经数据转换、数据清洗过程之后的数据集加载到目标数据仓库中,处理海量数据的批量装载。
[0011]本专利技术所实现的有益效果为:
[0012]本专利技术针对多源异构安全设备的告警日志数据,提出了一种表现更好的数据预处
理归一化处理方法,尤其是对基于多源异构安全设备的海量数据归一化处理,在传统数据预处理技术基础上,结合多源异构安全设备产生的告警日志通常需要将各类告警信息进行分类、聚类等处理需求,使用在分类和聚类算法中表现更为优秀的Z

score标准化方法来进行数据归一处理,为后续的数据分析打下良好基础,是一种表现更好的数据预处理归一化处理方法。
附图说明
[0013]图1为本专利技术所述的数据预处理流程示意图。
[0014]图2为本专利技术所述的Z

score标准化数据归一化处理流程示意图。
具体实施方式
[0015]为有关本专利技术的前述及其他
技术实现思路
、特点与功效,在以下配合参考附图对实施例的详细说明中,将可清楚的呈现。以下实施例中所提到的结构内容,均是以说明书附图为参考。
[0016]以下将参照附图,通过实施方式详细的描述本专利技术提供的多源异构安全设备海量数据归一化处理方法。
[0017]多源异构安全设备海量数据归一化处理方法,所述海量数据归一化处理方法包含四个步骤:
[0018]S1:进行数据抽取,从安全设备系统的数据库中抽取数据,建立数据表,将各个设备用唯一标示符进行表示;
[0019]S2:进行数据转换,采用Z

score标准化方法进行数据的标准化;
[0020]S3:进行数据清洗,对数据的一致性进行检查、修正错误数据与无效数据、填补缺失数据,将数据质量分层;
[0021]S4:进行数据装载,将历经数据转换、数据清洗过程之后的数据集加载到目标数据仓库中,处理海量数据的批量装载;
[0022]本方法在传统数据预处理技术基础上,结合Z

score标准化方法对具有海量、分散及异构的多源异构安全设备产生的告警日志数据进行数据归一化处理,为后续的数据分析工作打下良好基础。
[0023]所述S1:进行数据抽取,具体包含以下内容:
[0024]通常各大安全厂商的安全设备的告警分类各不相同,以电力安全防护为例,通常涉及到安全设备的类型包括防火墙、IPS、IDS、WAF和流量监控设备,而在这些设备中,通常对攻击源、受影响IP地址、攻击行为、攻击类型定义、攻击特征等信息进行记录,记录方式和分类标准自成体系,该步骤需要从这几类安全设备系统的数据库中抽取数据,抽取的具体数据信息需要根据需求建立数据表,例如安全设备类型一出现的告警信息、告警描述,根据要求需要建立一个以安全设备类型一为主键的表,涉及攻击IP、攻击名称、攻击数量等属性的数据仓库,然后根据数据仓库进行统计分析,在数据抽取的过程中同时涉及正确识别的问题,对于同一个设备X,假设设备X的设备名称在防火墙中表示为1X,在入侵防御中表示为2X,在入侵检测中表示为3X,在WEB应用防火墙中表示为4X,该类问题使的攻击行为被正确识别变得非常困难,进而影响了数据的正确抽取,为解决这个问题,根据原数据文件信息以
及一个或者多个特殊属性关系,将各个设备用唯一标示符进行表示;所述IPS为入侵防御系统,所述IDS为入侵检测系统,所述WAF为Web应用防护系统。
[0025]所述S2:进行数据转换,具体包含以下内容:
[0026]所述数据转换负责解决所抽取数据中存在的异构问题,即根据目标数据模型或者统一数据模型对数据进行数据格式转换、数据合并、数据过滤、关键数据的重新构建等操作,一般来说,数据转换可以分为格式、名称的统一和数据重新组合两类,在数据分析之前,通常需要先将数据标准化,利用标准化后的数据进行数据分析,数据标准化也就是统计数据的指数化,数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面,数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果,数据无量纲化处理主要解决数据的可比性,经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析,该过程中的异构数据所涉及到的数据归一化处理采用Z

score标准化方法,该方法也称为标准差标准化,给予原始数据的均值和标准差进行数据的标准化,经过处理的数据符合标准正态分布,即均值为0,标准差为1,在对数据进行Z
‑<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.多源异构安全设备海量数据归一化处理方法,其特征在于,所述海量数据归一化处理方法包含四个步骤:S1:进行数据抽取,从安全设备系统的数据库中抽取数据,建立数据表,将各个设备用唯一标示符进行表示;S2:进行数据转换,采用Z

score标准化方法进行数据的标准化处理;S3:进行数据清洗,对数据的一致性进行检查、修正错误数据与无效数据、填补缺失数据,进行数据质量分层;S4:进行数据装载,将历经数据转换、数据清洗过程之后的数据集加载到目标数据仓库中,处理海量数据的批量装载。2.如权利要求1所述的多源异构安全设备海量数据归一化处理方法,其特征在于,所述步骤S1:进行数据抽取,具体包含以下内容:安全设备的告警分类各不相同,安全设备的类型包括防火墙、IPS、IDS、WAF和流量监控设备,在安全设备中,定义攻击源、受影响IP地址、攻击行为、攻击类型,记录攻击特征,从安全设备系统的数据库中抽取数据,根据需求建立数据表;设一个安全设备的类型为安全设备类型一,安全设备类型一出现告警信息、告警描述,建立一个以安全设备类型一为主键的表,涉及攻击IP、攻击名称、攻击数量的数据仓库,根据仓库进行统计分析,对于同一个设备X,设定设备X的设备名称在防火墙中表示为1X,在入侵防御中表示为2X,在入侵检测中表示为3X,在WEB应用防火墙中表示为4X,将各个设备用唯一标示符进行表示;所述IPS为入侵防御系统,所述IDS为入侵检测系统,所述WAF为Web应用防护系统。3.如权利要求1所述的多源异构安全设备海量数据归一化处理方法,其特征在于,所述S2:进行数据转换,具体包含以下内容:所述数据转换对数据进行格式、名称的统一和数据重新组合,首先将数据标准化,利用标准化后的数据进行数据分析,数据标准化也就是统计数据的指数化,数据标准化处理包括数据同趋化处理和无量纲化处理两个方...

【专利技术属性】
技术研发人员:闫丽景党芳芳李帅岳纲毅李丁丁宋一凡李文萃刘晗梁慧超
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1