基于云雾协同的工业互联网敏感数据保护方法技术

技术编号:22056148 阅读:26 留言:0更新日期:2019-09-07 15:34
本发明专利技术公开了基于云雾协同的工业互联网敏感数据保护方法,本方法设计出一个工业敏感数据保护模型。对于工业延时敏感的数据,设计了一种基于Adaboost和本地差分隐私的数据保护方案,在确保数据可用性的基础上保护了敏感数据;对于工业非延时敏感、以云存储为主的数据,设计了一种基于AES加密和Reed‑Solomon编码的数据保护方案。本方法在本地采用分布式存储,并且对RS加了相应的限制条件,不仅解决了本地设备存储压力大和本地设备故障导致数据不能恢复的问题,而且提高了编码和解码效率,降低运算成本。

Industrial Internet Sensitive Data Protection Method Based on Cloud-fog Collaboration

【技术实现步骤摘要】
基于云雾协同的工业互联网敏感数据保护方法
本专利技术涉及一种应用于工业互联网中的基于雾云结合的敏感数据保护方法,属于工业数据保护

技术介绍
在工业生产过程中,会产生大量的敏感数据,包括生产线的制造流程、产品的成本信息、运营数据、操作信息和数据、市场营销策略以及知识产权和客户数据。一旦这些敏感数据泄露,可能会导致一个企业的重大业务损失,甚至名誉受损。在工业互联网背景下,保证敏感信息不被泄露是当前面临的重大挑战。在实际的工业场景中,有一些敏感数据是需要进行实时处理,例如现在的智能化工厂中做预测性维护的数据。如果一台数控机床发生严重故障,不仅会导致整个生产流水线的停工造成严重的经济损失,同时也严重耽误了产品生产周期。因此,为了避免这种情况发生,工厂应该及时做预测性维护工作,即实时采集无线传感器上的数据,对可能发生的情况进行预测,并按照预测的情况对可能发生的故障及时预警或者对机器进行及时的调整,避免机器发生意外停机。但是,如果将这部分实时采集的敏感数据发送到云端做预测性维护分析并不是一个可接受的解决方案,因为这会带来高延迟和繁重的通信负担。因此,雾计算应运而生。尽管雾计算在工业互联网背景下具有发展前景,但数据安全是雾计算中的一个关键问题。用于做预测性维护的数据中除了传感器实时采集的数据外,还包含传感器本身的设备信息、节点位置、空间坐标等,我们在雾端做预测性维护工作的同时,并不希望这些涉及位置以及设备本身的敏感数据被泄露。所以需要一种数据保护机制,使得在不影响数据可用性的基础上保护这些涉及位置以及设备本身的敏感数据。另外,工业敏感数据中除了有需要实时处理的敏感数据外,仍有大量非实时的敏感数据。例如公司的财务数据、库存数据、生产数据、收入与现金流量数据、营销计划、客户信息、知识产权和供应商信息等。这些数据通常情况下,会存储在第三方的云服务供应商。这些第三方云服务供应商声称他们存储的数据是加密的,但是他们也无法验证这一点,并且他们也不清楚谁可以在云存储中访问、管理和操纵他们的数据。因此,单纯的云计算已无法有效解决数据安全的问题。因此,需要设计一个雾和云协同的数据保护存储方案,一小部分数据存储在雾端,而其他的大部分数据存储在云端,使所设计的方案既可以充分利用云存储,又可以确保数据安全。针对以上两种问题,本文结合具体工业场景,设计出一个工业敏感数据保护模型,示意图如图2所示。对于工业延时敏感的数据,设计了一种基于Adaboost和本地差分隐私的数据保护方案,在确保数据可用性的基础上保护了敏感数据;对于工业非延时敏感、以云存储为主的数据,设计了一种基于AES加密和Reed-Solomon编码的数据保护方案。
技术实现思路
本专利技术的目的在于提出了基于云雾协同的工业互联网敏感数据保护方法,该方法改进之处在于本地采用分布式存储,并且对RS加了相应的限制条件,不仅解决了本地设备存储压力大和本地设备故障导致数据不能恢复的问题,而且提高了编码和解码效率,降低运算成本。本专利技术采用的技术方案为基于云雾协同的工业互联网敏感数据保护方法,该方法包括以下两个步骤:步骤(1)对于工业延时敏感的数据,设计出一种基于Adaboost算法和本地差分隐私的数据保护方案,示意图如图3所示。步骤(1.1)本地网关(工业网关)根据采集的实时数据,基于单层决策树构建弱分类器,并计算该分类器的错误率,然后重新调整每个样本的权重再次训练分类器。为了从所有弱分类器中得到最终的分类结果,Adaboost为每个分类器都分配了一个权重alpha,这些alpha的值是基于每个弱分类器的错误率ε进行计算的。其中错误率ε为:而alpha的计算公式如下:经过Adaboost分类后,将实时数据分为敏感数据和可预测性数据。步骤(1.2)根据步骤1.1的分类结果,将敏感数据即身份位置信息、空间坐标等采用本地差分隐私的rappor算法进行扰动,扰动步骤如下:步骤(1.2.1)利用BloomFilter技术将数据表示成一个长度为h的向量B={0,1}h并记录下字符串与Bloom串的映射关系矩阵。步骤(1.2.2)将向量B的每一位按照扰动规则对其进行扰动,得到永久性随机响应结果B′,其中扰动的规则P(B'=x)按照以下公式进行,f∈[0,1]表示概率取值:步骤(1.2.3)将B′中的每一位进行第二次扰动,得到瞬时性随机响应结果S。其中,第2次扰动的方式按照以下公式进行,其中p∈[0,1]和q∈[0,1]分别表示B′i取值为1和0时置si为1的概率:步骤(1.3)将可预测性数据与扰动后数据在本地网关做数据分析。由于这部分数据信息价值大,敏感性很强,不能将其上传至企业级服务器,因此将其暂存在本地网关,后期定期清理数据。由于对预测性维护的这部分数据用本地差分隐私算法进行了扰动,所以查询不到完整的实时数据,为了解决此问题,本方法将这部分数据进行步骤(2),详见步骤(2)。步骤(2)对于非延时敏感、以云存储为主的数据(财务数据、库存数据、生产数据等),设计了一种基于AES加密和Reed-Solomon编码的数据保护方案。并且在本地采用分布式存储,对RS加了相应的限制条件,解决了本地设备存储压力大和本地设备故障导致数据不能恢复的问题,并且提高了编码和解码效率,降低运算成本。示意图如图4所示。步骤(2.1)将非延时敏感、以云存储为主的数据(包含预测性维护的数据)在设备1进行AES加密,得到密文。步骤(2.2)将密文在设备1进行Reed-Solomon编码,得到编码后的数据。此时,这部分数据由三部分组成:冗余数据、预测性维护对应的编码后的数据以及其他非实时处理的数据。经过编码后,预测性维护的数据块为b,冗余数据块为m,其他非实时处理的数据块为k,本地设备数量为n。步骤(2.3)由于预测性维护数据的信息价值大,敏感性很强,需要将其存储在本地而非雾端,因此,在设备1上将预测性维护对应的编码后的数据根据本地设备数量分别存储在本地的不同设备上。步骤(2.4)考虑到在工厂中各个设备的运算能力不同,因此根据处理能力的强弱分配编码后数据块的数量,设备1收集本地其他设备的处理能力。步骤(2.5)根据收集的处理能力大小将编码后的大部分数据存储在运算能力最强的设备中。假设设备1、设备2……设备n的处理能力分别为a1、a2……an,其中a1>a2……>an。则将编码后的大多数数据块b1存储在设备1中,将其他数据(b-b1)根据不同设备的处理能力大小分别存储到其他设备。步骤(2.6)将其他k+m个数据块上传到雾服务器。为了满足本地设备故障后,还能恢复完整的数据,根据Reed-Solomon编码的特性,冗余数据块m必须满足:m≥b1。由于m的取值直接决定编码矩阵,m取值越大,矩阵运算量越大,编码时间和解码时间越长。因此,m取b1。这样,就解决了单个设备的存储压力和本地设备故障导致数据不能恢复的问题,同时又能最大限度的降低编码和解码时间,从而降低运算成本。步骤(2.7)雾服务器接收到k+m个数据块后,再次通过Reed-Solomon编码生成k+m个数据块和x个冗余数据块。将x+1个数据块存储在雾服务器,将其余数据上传到云服务器。这样,即使本地、雾、云三层数据中的一个被盗,窃取者也无法恢复完整的数据。因此,可本文档来自技高网
...

【技术保护点】
1.基于云雾协同的工业互联网敏感数据保护方法,其特征在于:该方法包括以下两个步骤,步骤(1)对于工业延时敏感的数据,设计出一种基于Adaboost算法和本地差分隐私的数据保护方案;步骤(1.1)本地网关根据采集的实时数据,基于单层决策树构建弱分类器,并计算该分类器的错误率,然后重新调整每个样本的权重再次训练分类器;为了从所有弱分类器中得到最终的分类结果,Adaboost为每个分类器都分配了一个权重alpha,这些alpha的值是基于每个弱分类器的错误率ε进行计算的;其中错误率ε为:

【技术特征摘要】
1.基于云雾协同的工业互联网敏感数据保护方法,其特征在于:该方法包括以下两个步骤,步骤(1)对于工业延时敏感的数据,设计出一种基于Adaboost算法和本地差分隐私的数据保护方案;步骤(1.1)本地网关根据采集的实时数据,基于单层决策树构建弱分类器,并计算该分类器的错误率,然后重新调整每个样本的权重再次训练分类器;为了从所有弱分类器中得到最终的分类结果,Adaboost为每个分类器都分配了一个权重alpha,这些alpha的值是基于每个弱分类器的错误率ε进行计算的;其中错误率ε为:而alpha的计算公式如下:经过Adaboost分类后,将实时数据分为敏感数据和可预测性数据;步骤(1.2)根据步骤1.1的分类结果,将敏感数据即身份位置信息、空间坐标采用本地差分隐私的rappor算法进行扰动,扰动步骤如下:步骤(1.2.1)利用BloomFilter技术将数据表示成一个长度为h的向量B={0,1}h并记录下字符串与Bloom串的映射关系矩阵;步骤(1.2.2)将向量B的每一位按照扰动规则对其进行扰动,得到永久性随机响应结果B′,其中扰动的规则P(B'=x)按照以下公式进行,f∈[0,1]表示概率取值:步骤(1.2.3)将B′中的每一位进行第二次扰动,得到瞬时性随机响应结果S;其中,第2次扰动的方式按照以下公式进行,其中p∈[0,1]和q∈[0,1]分别表示B′i取值为1和0时置si为1的概率:步骤(1.3)将可预测性数据与扰动后数据在本地网关做数据分析;由于这部分数据信息价值大,敏感性很强,不能将其上传至企业级服务器,因此将其暂存在本地网关,后期定期清理数据;由于对预测性维护的这部分数据用本地差分隐私算法进行了扰动,所以查询不到完整的实时数据,为了解决此问题,本方法将这部分数据进行步骤(2),详见步骤(2);步骤(2)对于非延时敏感、以云存储为主的数据,设计了一种基于AES加密和Reed-Solomon编码的数据保护方案;并且在本地采用分布式存储,对RS加了相应的限制条件,解决了本地设备存储压力大和本地设备故障导致数据不能恢复的问题,并且提高了编码和解码效率,降低运算成本;步骤(2.1)将非延时敏感、以云存储为主的数据在设备1进行AES加密,得到密文;步骤(2.2)将密文在设备1进行Reed-Solomon编码,得到编码后的数据;此时,这部分数据由三部分组成:冗余数据、预测性维护对应的编码后的数据以及其他非实时处理的数据;经过编码后,预测性维护的数据块为b,冗余数据块为m,其他非实时处理的数据块为k,本地设备数量为n;步骤(2.3)由于预测性维护数据的信息价值大,敏感性很强,需要将其存储在本地而非雾端,因此,在设备1上将预测性维护对应的编码后的数据根据本地设备数量分别存储在本地的不同设备上;步骤(2.4)考虑到在工厂中各个设备的运算能力不同,因此根据处理能力的强弱分配编码后数据块的数量,设备1收集本地其他设备的处理能力;步骤(2.5)根据收集的处理能力大小将编码后的大部分数据存储在运算能力最强的设备中;假设设备1、设备2……设备n的处理能力分别为a1、a2……an,其中a1>a2……>an;则将编码后的大多数数据块b...

【专利技术属性】
技术研发人员:刘静原昌博赖英旭唐通宿骞赵子健薛德凡
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1