一种计及攻击的能源互联网数据可靠存储系统技术方案

技术编号:27468519 阅读:24 留言:0更新日期:2021-03-02 17:32
一种计及攻击的能源互联网数据可靠存储系统,提出是一种在网络攻击环境下能源互联网数据的可靠容错存储的一种存储系统,能够保证能源互联网数据的安全存储以及无损恢复,它主要包含四个部分:用户请求数据服务建模、用户选择数据服务建模、最优海量数据分割、分布式数据恢复。本系统将用户请求数据和用户选择数据结合起来建立准确的用户访问数据模型,将粗糙集、基因表达式编程和Erasure Code编码运用到能源互联网数据存储以及恢复,十分贴合能源互联网中的数据可靠存储,可以保证能源互联网海量数据的分布式存储的可靠性。海量数据的分布式存储的可靠性。海量数据的分布式存储的可靠性。

【技术实现步骤摘要】
一种计及攻击的能源互联网数据可靠存储系统


[0001]本专利技术属于电力系统信息安全领域,具体涉及一种计及攻击的能源互联网数据可靠存储系统。

技术介绍

[0002]随着信息通信技术的不断发展,电力、石油等领域的传统工业控制系统正在从孤岛式、封闭式结构,转变为开放结构,生产环境从手工或半自动化形式转变为网络自动化形式,越来越多的终端设备通过公共网络连接来搭建、管理和控制,这将导致信息安全形势日益严峻。目前,现有的电力系统二次防护方案和智能电网信息安全防护方案难以满足对能源互联网下各类型数据的安全防护,仍然存在一定的盲目性和不完善性,当前复杂的网络环境使得针对开放共享的能源互联网数据的攻击行为日益频繁,传统的数据加密防护和集中式数据存储难以对发生极端破坏(如恶意删除等)后的关键数据进行及时有效恢复。因此,一个合理、完善的能源互联网数据可靠存储方案就显得格外重要。
[0003]随着能源互联网数据来源越来越广泛而使得数据呈现海量、分布的特征,使得针对能源互联网数据的入侵攻击行为日益频繁。保证这些关键业务数据在发生攻击时分布式存储的安全性和可靠性是整个能源互联网安全稳定运行的重要前提。因此,有必要研究计及攻击的能源互联网数据无损恢复技术,增加能源互联网海量数据分布式存储的可靠性。
[0004]现有的分布式数据存储方案不能及时准确地恢复出原始数据,因此针对计及攻击的能源互联网数据提出一种新的有效的可靠存储技术系统对能源互联网的数据保护意义重大。
[0005]计及攻击的能源互联网数据可靠存储系统主要需考虑两个方面的问题:
[0006](1)如何通过引入粗糙集、数据挖掘以及Erasure编码思想,在构建和分析用户访问能源互联网数据的行为模型;
[0007](2)如何实现能源互联网海量数据的最优分割,且保证数据存储资源的最佳利用,同时结合云计算平台,实现入侵攻击后分布式存储数据的无损恢复。

技术实现思路

[0008]本专利技术的目的是提供一种计及攻击的能源互联网数据可靠存储系统,来安全存储并快速恢复能源互联网数据,本专利技术是一种策略性方法,通过能源互联网各环节访问数据的行为特征,拟通过概率论、随机过程、粗糙集、基因表达式编程以及Erasure Code等理论方法,从而来最终实现网络攻击环境下能源互联网数据的可靠容错存储,可以使得网络攻击环境下能源互联网数据的可靠容错存储,保证各类业务系统正常提供服务。
[0009]一种计及攻击的能源互联网数据可靠存储系统,包括用户请求数据服务建模模块、用户选择数据服务建模模块、最优海量数据分割模块和分布式数据恢复模块四个部分;
[0010]用户请求数据服务建模模块获取任意两个用户进入存储系统的时间差和任何一时刻用户的数量,通过基于泊松分布来构建用户请求数据服务模型;用户选择数据服务建
模模块基于Zipf分布构建用户选择数据服务模型;最优海量数据分割模块将能源互联网海量数据或副本分割成若干块;分布式数据恢复模块采用Erasure Code编码从数据恢复的角度来对受损的数据或其副本进行无损恢复。
[0011]进一步地,用户请求数据服务建模模块中,设访问能源互联网数据存储系统的各终端用户的行为具有独立性且服从泊松分布的基础上,基于泊松分布来构建用户请求数据服务模型;首先根据上述条件,用户进入存储系统的行为满足下式:
[0012][0013]其中,P
k
(t0,t)表示在t0时刻到t时刻用户请求到达的个数为k的概率,λ为终端用户数据请求的频率;同时设一个长为h>0的很小一段时间内有一个终端用户请求到达的概率为hλ+o(h),那么没有终端用户到达的概率为1-hλ+o(h),多个终端用户到达的概率为o(h);如果此时存储服务器空闲,则立即给用户服务,否则到达的终端用户排队等候,X(t)为t时刻存储系统的访问用户数,排队长度为L
q
,系统状态空间为e={1,2,..,L
q
},在t=0时刻存储系统空闲,得到t时刻存储系统所处的状态,从而最终构建出用户请求数据服务模型。
[0014]进一步地,用户选择数据服务建模模块用下式表示:
[0015][0016]其中表示在所有的n个数据及其副本中,第i个数据或副本被访问的频率,式中θ为常数,θ越大表示能源互联网各环节中核心业务数据的选择频率越高。
[0017]进一步地,θ根据数据或其副本实际选择情况来求出;首先设某一个能源互联网环节的分布式存储系统中存储n个数据文件,记为F
i
(i=1,2,......,n),终端用户对数据或其副本文件F
i
的访问符合Zipf分布,一段时间t内,用户对数据或其副本文件F
i
的访问次数为q
i
,则分布式存储系统中数据文件F
i
的受欢迎程度为其中N为数据或者副本文件总共被访问的次数,ρ
i
越大,说明该数据或其副本文件F
i
越受用户欢迎,也表示存储数据或其副本文件F
i
的存储资源越繁忙;然后通过计算每一个数据或其副本文件访问的概率,通过样本对θ进行估计,最终得到θ值,以此构建出用户选择数据服务的模型。
[0018]进一步地,最优海量数据分割模块中,数据分割即在尽可能不影响数据决策效果的情况下,将一个具有较大规模的数据集通过某种分割规则分割为数个具有较小规模的不相交的子集;设原始数据集为S,各个数据子集为S
i
,即:
[0019][0020]其中
[0021]对所有的条件属性集A基于分治法的思想进行维度约简,得到原始数据集的条件属性约简集合A',此时|A|<|A'|,然后再利用粗糙集对A'进行计算。
[0022]进一步地,分布式数据恢复模块中,采用Erasure Code编码从数据恢复的角度来对受损的数据或其副本进行无损恢复,包括如下步骤:
[0023]步骤a,将待存储的原始数据集通过数据分割算法分为m块,并对其进行编码生成n块数据,产生k=n-m个校验码,则每个校验码用下式表示:
[0024][0025]即C=FD,其中C为校验数据向量,F是m
×
k型的系数矩阵,采用范德蒙矩阵,D是原始数据分块向量;
[0026]步骤b,定义矩阵若有少于k个的数据块丢失,则将丢失数据块所对应的矩阵A、E中所对应的行删除得到A'、E',然后通过计算D=(A')-1
E'来恢复出原始数据D;
[0027]步骤c,利用基因表达式编程算法挖掘数据块数K、编码个数N、存储节点个数S、网络带宽B、数据大小R与数据恢复时间T之间的非线性函数模型T=f(K,N,S,B,R),通过最优化算法求解出当数据块数K、存储节点个数S以及网络带宽B、数据大小R满足一定条件时的最小的编码个数,使得数据恢复时间T最小;
[0028]步骤d,基于Hadoop平台对上述步骤进行分布式并行设计。
[0029]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计及攻击的能源互联网数据可靠存储系统,其特征在于:所述存储系统中,包括用户请求数据服务建模模块、用户选择数据服务建模模块、最优海量数据分割模块和分布式数据恢复模块四个部分;用户请求数据服务建模模块获取任意两个用户进入存储系统的时间差和任何一时刻用户的数量,通过基于泊松分布来构建用户请求数据服务模型;用户选择数据服务建模模块基于Zipf分布构建用户选择数据服务模型;最优海量数据分割模块将能源互联网海量数据或副本分割成若干块;分布式数据恢复模块采用Erasure Code编码从数据恢复的角度来对受损的数据或其副本进行无损恢复。2.根据权利要求1所述的一种计及攻击的能源互联网数据可靠存储系统,其特征在于:用户请求数据服务建模模块中,设访问能源互联网数据存储系统的各终端用户的行为具有独立性且服从泊松分布的基础上,基于泊松分布来构建用户请求数据服务模型;首先根据上述条件,用户进入存储系统的行为满足下式:其中,P
k
(t0,t)表示在t0时刻到t时刻用户请求到达的个数为k的概率,λ为终端用户数据请求的频率;同时设一个长为h>0的很小一段时间内有一个终端用户请求到达的概率为hλ+o(h),那么没有终端用户到达的概率为1-hλ+o(h),多个终端用户到达的概率为o(h);如果此时存储服务器空闲,则立即给用户服务,否则到达的终端用户排队等候,X(t)为t时刻存储系统的访问用户数,排队长度为L
q
,系统状态空间为e={1,2,..,L
q
},在t=0时刻存储系统空闲,得到t时刻存储系统所处的状态,从而最终构建出用户请求数据服务模型。3.根据权利要求1所述的一种计及攻击的能源互联网数据可靠存储系统,其特征在于:用户选择数据服务建模模块用下式表示:其中表示在所有的n个数据及其副本中,第i个数据或副本被访问的频率,式中θ为常数,θ越大表示能源互联网各环节中核心业务数据的选择频率越高。4.根据权利要求3所述的一种计及攻击的能源互联网数据可靠存储系统,其特征在于:θ根据数据或其副本实际选择情况来求出;首先设某一个能源互联网环节的分布式存储系统中存储n个数据文件,记为F
i
(i=1,2,......,n),终端用户对数据或其副本文件F
i
的访问符合...

【专利技术属性】
技术研发人员:邓松翟羽佳张建堂祝展望胡琦聪岳东袁欣雅陈福林
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1