基于大数据的数据安全保护及预警方法技术

技术编号:38864824 阅读:28 留言:0更新日期:2023-09-17 10:05
本发明专利技术涉及数据处理领域,具体涉及基于大数据的数据安全保护及预警方法,包括:获取服务器组中每个节点的数据包;获取历史访问次数序列u中低历史访问次数的用户总量,将序列u划分为若干段,根据每段每种报文类型的用户数量获得调用曲线,然后将调用曲线划分为两部分,记为第一曲线和第二曲线;根据第一占、第一曲线和第二曲线获得节点遭受攻击的可能性;根据节点遭受攻击的可能性判断节点是否遭到攻击,当节点没有遭到攻击时,将数据包拆分为若干子数据包,获取服务器组被攻击可能性,根据服务器组被攻击可能性判断服务器组是否遭到攻击,当服务器组遭到攻击时进行预警。本发明专利技术用数据处理获得节点被攻击的可能性,提高服务器组预警的准确性。警的准确性。警的准确性。

【技术实现步骤摘要】
基于大数据的数据安全保护及预警方法


[0001]本专利技术涉及数据处理领域,具体涉及基于大数据的数据安全保护及预警方法。

技术介绍

[0002]服务器云系统中,对于大流量访问时,服务器调度其他节点处理访问数据,避免单节点数据堆积。同时攻击数据夹杂在正常访问数据中传输至服务器,需要服务器将异常数据拦截,防止异常数据从某节点进入服务器。
[0003]通过访问数据包中ICMP报文信息类型以及用户访问的频率数据进行服务器组处于攻击环境的评价,改进常规拦截固定报文类型以及关闭部分服务器啊安全策略会降低服务器的可用性的缺陷。

技术实现思路

[0004]本专利技术提供基于大数据的数据安全保护及预警方法,以解决现有的问题。
[0005]本专利技术的基于大数据的数据安全保护及预警方法采用如下技术方案:本专利技术一个实施例提供了基于大数据的数据安全保护及预警方法,该方法包括以下步骤:获取服务器组中每个节点的数据包;获取数据包中历史访问次数构成的序列u,根据序列u获得低历史访问次数对应的用户总量,低历史访问次数对应的用户总量与数据包中用户总数的比值记为第一占比,根据数据包中用户总数将序列u划分为若干段,根据每段中属于每种报文类型的用户数量获得每种报文类型的调用曲线,根据第一占比将每种报文类型的调用曲线划分为两部分,记为第一曲线和第二曲线;根据第一占比以及第一曲线和第二曲线的差异获得节点遭受攻击的可能性;根据节点遭受攻击的可能性判断节点是否遭到攻击,当节点没有遭到攻击时,根据服务器组的算力将数据包拆分为若干子数据包,根据所有节点接收子数据包时的遭受攻击的可能性获得服务器组被攻击可能性,根据服务器组被攻击可能性判断服务器组是否遭到攻击,当服务器组遭到攻击时进行预警。
[0006]进一步地,所述获取数据包中历史访问次数构成的序列u,根据序列u获得低历史访问次数对应的用户总量,包括的具体步骤如下:预设一个比例阈值Q,将历史访问次数从小到大排列得到序列u,获取序列u中顺序在前的历史访问次数,记为低历史访问次数,统计低历史访问次数对应的用户数,即得到低历史访问次数对应的用户总量。
[0007]进一步地,所述根据数据包中用户总数将序列u划分为若干段,包括的具体步骤如下:根据节点的并发处理数,将数据包中的历史访问次数序列等分为个段,其
中,中表示向上取整符号,表示数据包中的用户总数。
[0008]进一步地,所述根据每段中属于每种报文类型的用户数量获得每种报文类型的调用曲线,包括的具体步骤如下:获取各段中的总用户数量和报文类型为的用户数量,将任意段中报文类型为的用户数量除以对应段的总用户数量,得到各段中报文类型为的调用比例,通过所有段中报文类型为的调用比例拟合得到一条报文类型为的调用曲线;再获取各段中的总用户数量和报文类型为的用户数量,将任意段中报文类型为的用户数量除以对应段的总用户数量,得到各段中报文类型为的调用比例,通过各段中报文类型为的调用比例拟合得到一条报文类型为的调用曲线;以此类推,得到所有报文类型的调用曲线。
[0009]进一步地,所述第一曲线的具体获取步骤如下:根据第一占比将每种报文类型的调用曲线进行切分成两部分,将前一部分的曲线记为第一曲线。
[0010]进一步地,所述第二曲线的具体获取步骤如下:根据第一占比将每种报文类型的调用曲线进行切分成两部分,将后一部分的曲线记为第二曲线。
[0011]进一步地,所述根据第一占比以及第一曲线和第二曲线的差异获得节点遭受攻击的可能性,包括的具体步骤如下:节点遭受攻击的可能性公式为:式中,表示第t中报文类型的最大历史访问次数,表示当前数据包中的总用户数量,表示低历史访问次数的用户数量,k表示为第k个报文类型数量,表示在第t种报文类型对应的调用曲线函数,exp表示以自然数为底的指数函数,表示节点遭受攻击的差异特征,表示第一占比;式中,表示节点遭受攻击的差异特征,表示节点遭受攻击的可能性,表示双曲正切函数。
[0012]进一步地,所述根据服务器组的算力将数据包拆分为若干子数据包,包括的具体
步骤如下:各服务器的算力记为,其中表示第n个服务器的算力,n表示服务器组中节点的总数;在服务器组总算力中占有的比例,将数据包拆分,具体为:将中个用户的数据打包成数据包,将个用户的数据打包成数据包,以此类推,将个用户的数据打包成数据包;其中,表示数据包中的用户总数,数据包、数据包、
……
、数据包均称为子数据包。
[0013]进一步地,所述根据所有节点接收子数据包时的遭受攻击的可能性获得服务器组被攻击可能性,包括的具体步骤如下:服务器组被攻击可能性的公式为:式中,表示被攻击节点的被攻击可能性,G表示被攻击节点的数量,表示所有节点在接收子数据包之后的被攻击可能性,n表示服务器组所有节点的数量,表示服务器组的被攻击可能性。
[0014]进一步地,所述根据服务器组被攻击可能性判断服务器组是否遭到攻击,包括的具体步骤如下:当服务器组被攻击可能性大于等于服务器组预设的安全策略阈值时,判定服务器组遭受攻击。
[0015]本专利技术的技术方案的有益效果是:(1)本专利技术结合ICMP报文信息类型以及用户访问的频率数据在当前数据点中的不同分布情况对单节点被攻击的评价,并综合多节点对数据包异常的不同评价综合为服务器组的被攻击评价。传统直接丢弃预设报文类型或拦截固定报文类型的保护手段,丢失服务器部分业务拓展能力,降低用户的使用体验。本专利技术与之相比,能够分析报文类型与访问频率的统计差异进行攻击判断,在不减少服务器业务拓展能力的情况下达到了更精准的攻击评价,令服务器的安全防御策略更加智能。
[0016](2)相比传统分析报文内部数据的拦截手段,在大流量访问的环境下难以达到对攻击响应的实时性要求。以及神经网络分析手段需要预先设置参数并保证模型训练精度才能达到一定的拦截水平。本专利技术通过历史数据作为评价标准,并通过数据类型差异进行比较评价,比较运算占用服务器资源更低的同时,历史监测数据指标随服务器使用能够达到更高的监测精度,在服务器攻击抵御中具有指标的自锐性。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为本专利技术基于大数据的数据安全保护及预警方法的步骤流程图;图2为本专利技术基于大数据的数据安全保护及预警方法的访问次数与用户量关系示意图;图3为本专利技术基于大数据的数据安全保护及预警方法的第一种报文类型调用曲线示意图;图4为本专利技术基于大数据的数据安全保护及预警方法的第二种报文类型调用曲线示意图;图5为本专利技术基于大数据的数据安全保护及预警方法的第一种报文类型调用曲线二分示意图。
具体实施方式
[0019]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于大数据的数据安全保护及预警方法,其特征在于,该方法包括以下步骤:获取服务器组中每个节点的数据包;获取数据包中历史访问次数构成的序列u,根据序列u获得低历史访问次数对应的用户总量,低历史访问次数对应的用户总量与数据包中用户总数的比值记为第一占比,根据数据包中用户总数将序列u划分为若干段,根据每段中属于每种报文类型的用户数量获得每种报文类型的调用曲线,根据第一占比将每种报文类型的调用曲线划分为两部分,记为第一曲线和第二曲线;根据第一占比以及第一曲线和第二曲线的差异获得节点遭受攻击的可能性;根据节点遭受攻击的可能性判断节点是否遭到攻击,当节点没有遭到攻击时,根据服务器组的算力将数据包拆分为若干子数据包,根据所有节点接收子数据包时的遭受攻击的可能性获得服务器组被攻击可能性,根据服务器组被攻击可能性判断服务器组是否遭到攻击,当服务器组遭到攻击时进行预警。2.根据权利要求1所述基于大数据的数据安全保护及预警方法,其特征在于,所述获取数据包中历史访问次数构成的序列u,根据序列u获得低历史访问次数对应的用户总量,包括的具体步骤如下:预设一个比例阈值Q,将历史访问次数从小到大排列得到序列u,获取序列u中顺序在前的历史访问次数,记为低历史访问次数,统计低历史访问次数对应的用户数,即得到低历史访问次数对应的用户总量。3.根据权利要求1所述基于大数据的数据安全保护及预警方法,其特征在于,所述根据数据包中用户总数将序列u划分为若干段,包括的具体步骤如下:根据节点的并发处理数,将数据包中的历史访问次数序列等分为个段,其中,中表示向上取整符号,表示数据包中的用户总数。4.根据权利要求1所述基于大数据的数据安全保护及预警方法,其特征在于,所述根据每段中属于每种报文类型的用户数量获得每种报文类型的调用曲线,包括的具体步骤如下:获取各段中的总用户数量和报文类型为的用户数量,将任意段中报文类型为的用户数量除以对应段的总用户数量,得到各段中报文类型为的调用比例,通过所有段中报文类型为的调用比例拟合得到一条报文类型为的调用曲线;再获取各段中的总用户数量和报文类型为的用户数量,将任意段中报文类型为的用户数量除以对应段的总用户数量,得到各段中报文类型为的调用比例,通过各段中报文类型为的调用比例拟合得到一条报文类型为的调用曲线;以此类推,得到所有报文类型的调用曲线。5.根据权...

【专利技术属性】
技术研发人员:田常立张拂晓王龙伟沈淼宇张停停翟广厦庄敏文灿仲海珊续兰兰
申请(专利权)人:智联信通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1