一种大数据网络安全数据传输方法技术

技术编号:36555828 阅读:10 留言:0更新日期:2023-02-04 17:10
本发明专利技术涉及数据加密传输领域,具体涉及一种大数据网络安全数据传输方法,收集网站被攻击的日志数据集信息并进行规范化处理,得到规范化的数据集;提取数据集中的每条数据的日志数据信息特征;根据攻击对象对数据集进行分组,得到各数据组;对于每个数据组的数据,基于数据的时间戳、攻击来源以及攻击方式的信息特征进行权重分配,得到对应信息特征的投票权重;利用投票权重对各数据组进行数据加权,获取加权数据信息,进而得到加权数据信息集;根据加权数据信息集,对所有数据组进行分层,对各层进行加密,不同层的加密方式不同。本发明专利技术的方案能够根据数据特征进行筛选分类,对筛选分类后的日志进行不同的加密,提高传输的可靠性。性。性。

【技术实现步骤摘要】
一种大数据网络安全数据传输方法


[0001]本专利技术涉及数据加密传输领域,具体涉及一种大数据网络安全数据传输方法。

技术介绍

[0002]随着科技发展,电子信息技术已经逐步趋向于成熟,这种趋势下人们对于网络的使用越来越多,而且网络结合人们生活中各种需求导致数据量大量的增加,致使现在步入了大数据的时代。而大数据分为许多类型,例如网络安全数据,最显而易见的网络安全数据为网址网站被攻击的日志信息,其具有大量、高速、多样、低价值密度以及真实性的5个特点。而且其相较于传统数据相比,具有较强的社会属性,所以在数据传输的过程中为了实现大数据的安全传输需要结合很多方面来解决大数据的安全传输问题。
[0003]现有的安全数据传输方法主要是基于DES加密算法进行加密,但是大数据因为其独特的数据结构,单条数据的低价值密度的特点,在采用DES加密算法或DES变种加密算法对数据进行加密的时候容易造成大量的资源浪费。

技术实现思路

[0004]为了解决上述技术问题,本专利技术的目的在于提供了一种大数据网络安全数据传输方法,所采用的技术方案具体如下:
[0005]本专利技术提供的一种信息数据加密算法的技术方案,包括以下步骤:
[0006]收集网站被攻击的日志数据集信息并进行规范化处理,得到规范化的数据集;
[0007]提取所述数据集中的每条数据的日志数据信息特征,包括时间戳、攻击来源、攻击对象以及攻击方式;根据所述攻击对象对所述数据集进行分组,得到各数据组;
[0008]对于每个数据组的数据,基于数据的时间戳、攻击来源以及攻击方式的信息特征进行权重分配,得到对应信息特征的投票权重;
[0009]利用所述投票权重对各数据组进行数据加权,获取加权数据信息,进而得到加权数据信息集;
[0010]根据所述加权数据信息集,对所有数据组进行分层,对各层进行加密,不同层的加密方式不同。
[0011]进一步地,所述分组的过程为:统计每条数据的攻击来源,获得攻击对象标签序列,利用所述攻击对象标签序列对数据集中所有数据进行聚类,每条数据攻击对象标签序列相同的视为一类,最后根据类别将数据分组。
[0012]进一步地,对应信息特征的投票权重为:
[0013]时间戳的投票权重α
b
为:
[0014][0015]其中,ρ
d
为邻域内数据密度,D为邻域总个数;
[0016]攻击来源的投票权重β
b
为:
[0017][0018]其中,Ats
m
为数据被攻击的第m个攻击来源,n(Ats
m
)为第m个攻击来源的次数,M为攻击来源的总个数;为所有不同M个攻击来源的攻击次数的均值,为所有不同M个攻击来源的攻击次数的均值,表示为第m个攻击来源攻击次数的权值,表示为和攻击次数均值的差异;
[0019]攻击方式的投票权重γ
b
为:
[0020][0021]其中,Att
h
为数据被第h种攻击方式攻击后所产生的新数据,H为攻击方式的总个数。
[0022]进一步地,加权数据信息为:
[0023][0024]其中,α
b
为时间戳的投票权重,β
b
为攻击来源的投票权重,γ
b
攻击方式的投票权重,I为第b个数据组的数据总个数。
[0025]进一步地,对所有数据组进行分层的过程为:
[0026]计算所述加权数据信息集的均值,根据所述均值,确定第一阈值和第二阈值,所述第一阈值小于第二阈值;
[0027]按照各加权数据信息的升序排列的方式,将小于第一阈值的加权数据信息对应的数据组,作为第一层数据,将大于第一阈值小于第二阈值的加权数据信息对应的数据组,作为第二层数据,将大于第二阈值的加权数据信息对应的数据组,作为第三层数据。
[0028]进一步地,所述不同层的加密方式不同,具体为:对第一层数据不加密,对第二层数据进行部分加密,对第三层数据进行全部加密处理。
[0029]进一步地,所述不同层的加密方式不同,具体为:对第一层数据、第二层数据以及第三层数据分别采用不同的加密算法进行加密。
[0030]本专利技术的有益效果:
[0031]本专利技术的方案是通过对网站的被攻击的日志数据信息进行规范化,获得规范后的日志数据信息;基于规范后的日志数据信息进行特征分析,而后根据数据特征进行筛选分类;对筛选分类后的所有数据组进行基于DES的加密算法的分层加密传输,能够提高数据传输的安全性。
附图说明
[0032]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0033]图1是本专利技术的一种大数据网络安全数据传输方法的方法流程图。
具体实施方式
[0034]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术的方案,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0035]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0036]本专利技术所针对的场景为:在网站网址被攻击后会产生大量的日志数据信息,而为了对被攻击的网站更好的完善操作,需要对被攻击的日志来源以及被攻击的特性和特征进行传输来分析,而数据的传输过程中因为其属于大数据所以加密时极容易造成不必要信息加密造成资源的浪费。所以通过对日志数据信息进行规范化,而后对规范化后的信息进行分类和投票,依据分类和投票结果对其进行加密实现网络安全数据传输。
[0037]具体地,对本专利技术提供的一种大数据网络安全数据传输方法进行介绍,请参阅图1所示,包括以下步骤:
[0038]首先,收集网站被攻击的日志数据集信息并进行规范化处理,得到规范化的数据集;
[0039]提取所述数据集中的每条数据的日志数据信息特征,包括时间戳、攻击来源、攻击对象以及攻击方式;根据所述攻击对象对所述数据集进行分组,得到各数据组。
[0040]本专利技术需要进行对大数据的分类加密,而网站被攻击所生成的日志数据大多数为非结构化或者半结构化,故首先本实施例中需要将网站被攻击所生成的日志数据信息进行预处理,使其规范化;设置规范化后的数据的结构,具体结构为:Tts+Ats+Ata+Att,其中,Tts为时间戳,Ats为攻击来源,Ata为攻击对象,Att为攻击方式。
[0041]以上述结构对所有的网站网址被攻击的所生成的日志数据集信息进行规范化,获得规范化后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大数据网络安全数据传输方法,其特征在于,包括以下步骤:收集网站被攻击的日志数据集信息并进行规范化处理,得到规范化的数据集;提取所述数据集中的每条数据的日志数据信息特征,包括时间戳、攻击来源、攻击对象以及攻击方式;根据所述攻击对象对所述数据集进行分组,得到各数据组;对于每个数据组的数据,基于数据的时间戳、攻击来源以及攻击方式的信息特征进行权重分配,得到对应信息特征的投票权重;利用所述投票权重对各数据组进行数据加权,获取加权数据信息,进而得到加权数据信息集;根据所述加权数据信息集,对所有数据组进行分层,对各层进行加密,不同层的加密方式不同。2.根据权利要求1所述的一种大数据网络安全数据传输方法,其特征在于,所述分组的过程为:统计每条数据的攻击来源,获得攻击对象标签序列,利用所述攻击对象标签序列对数据集中所有数据进行聚类,每条数据攻击对象标签序列相同的视为一类,最后根据类别将数据分组。3.根据权利要求1所述的一种大数据网络安全数据传输方法,其特征在于,对应信息特征的投票权重为:时间戳的投票权重α
b
为:其中,ρ
d
为邻域内数据密度,D为邻域总个数;攻击来源的投票权重β
b
为:其中,Ats
m
为第m个数据被攻击的攻击来源,n(Ats
m
)为第m个攻击来源的次数,M为攻击来源的总个数;为所有不同M个攻击来源的攻击次数的均值,为所有不同M个攻击来源的攻击次数...

【专利技术属性】
技术研发人员:冯景钊刘浩王家伟
申请(专利权)人:成都钊峪半网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1