一种基于卷积神经网络的电力量测数据脱敏方法技术

技术编号:38885054 阅读:11 留言:0更新日期:2023-09-22 14:13
本发明专利技术公开一种基于卷积神经网络的电力量测数据脱敏方法,包括:步骤S1,将未脱敏的电力量测数据输入训练好的卷积神经网络模型中,得到所述电力量测数据中的敏感数据集;步骤S2,对所述敏感数据集中的敏感数据进行聚类;步骤S3,采用相应的脱敏模型对各个聚类的敏感数据进行脱敏。本发明专利技术使用擅长进行图像处理的CNN网络作为敏感数据的预测模型,为敏感数据的预测提供了一种新的思路,相比于该领域内其他脱敏方法,本发明专利技术能够处理大量数据,拥有更高的处理效率和更强大的处理能力,具有实用意义。义。义。

【技术实现步骤摘要】
一种基于卷积神经网络的电力量测数据脱敏方法


[0001]本专利技术涉及电力数据安全
,具体涉及一种基于卷积神经网络的电力量测数据脱敏方法。

技术介绍

[0002]随着数据时代的到来,传统的电力行业也向着信息化、数字化的方向发展,电网在运行过程中会产生许多的电力量测数据。电力量测数据记录了用户用电信息、用户身份信息等众多信息,是企业进行总结、规划参考的基本材料,也是企业至关重要的有形资产,涉及到众多的商业机密、客户隐私与经营技术等敏感信息。这些数据对电网的正常运行具有很重要的作用且只有流动起来才能够发挥其作用,但一旦泄露将会造成严重后果。
[0003]电力量测数据脱敏技术能够保证电力量测数据在传输过程中不泄露个人隐私信息,在隐私保护要求越来越严苛的背景下,该技术对于电力行业数字化信息化的发展具有重大意义。卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络”。卷积神经网络被广泛应用于图像识别处理,但应用于数据处理的研究还比较少,因此如何使用卷积神经网络来进行电力量测数据脱敏,具有研究的必要和空间。

技术实现思路

[0004]本专利技术所要解决的技术问题在于,提供一种基于卷积神经网络的电力量测数据脱敏方法,以提高处理效率和处理能力。
[0005]为解决上述技术问题,本专利技术提供一种基于卷积神经网络的电力量测数据脱敏方法,包括:
[0006]步骤S1,将未脱敏的电力量测数据输入训练好的卷积神经网络模型中,得到所述电力量测数据中的敏感数据集;
[0007]步骤S2,对所述敏感数据集中的敏感数据进行聚类;
[0008]步骤S3,采用相应的脱敏模型对各个聚类的敏感数据进行脱敏。
[0009]进一步地,所述步骤S1具体包括:
[0010]所述训练好的卷积神经网络模型的输入层对输入的未脱敏的电力量测数据进行预处理,得到数据向量矩阵;
[0011]在卷积层对数据向量矩阵进行卷积,数据经卷积运算和激活函数运算之后得到多个特征映射,提取出特征向量;
[0012]特征向量进入池化层进行池化;
[0013]数据进入全连接层进行拟合;
[0014]输出预测的电力量测数据中的敏感数据集。
[0015]进一步地,所述预处理具体包括:使用预定义的实体标签对电力量测数据进行标
记,标记后再根据实体标签对电力量测数据进行分割,分割之后使用word2vec对数据进行转换,将文本信息转换为数据向量矩阵。
[0016]进一步地,提取特征向量的方式为:
[0017]x'=f(∑x
·
k+b)
[0018]其中,x'是输出特征,x是输入特征,k是权值,b是加性偏置,f(*)是激活函数。
[0019]进一步地,池化层将卷积层输出的特征向量根据语义相似度进行合并:
[0020]x'=f(β
·
pooling(x)+b)
[0021]其中,pooling(x)表示对输入特征进行池化,β是乘性偏置。
[0022]进一步地,所述步骤S2具体包括:
[0023]步骤S21,从敏感数据集中选取身份证号信息、用户姓名、用电量、地址四个数据对象,每个数据对象代表一个初始质心;
[0024]步骤S22,对于敏感数据集中剩下的数据对象,根据其与各个初始质心的距离,将它分配到距离最近的簇;
[0025]步骤S23,重新计算每个簇的中心,计算归属于簇的数据对象平均值,作为每个簇的新的聚类中心;
[0026]重复步骤S22和步骤S23进行迭代计算,直到聚类结果趋于稳定,将敏感数据分为四个聚类:名称类数据、号码类数据、数值类数据和地址类数据。
[0027]进一步地,对于名称类数据进行脱敏时采用文本替换的方式,将原始名称中的文本替换成预设的数字。
[0028]进一步地,对于号码类数据在进行脱敏时使用掩码的方式,将原始号码数据遮盖掉一部分。
[0029]进一步地,对于数值类数据在进行脱敏时使用公式变换的方式,将原始数值通过公式变换之后得到新的数值,变换公式为:
[0030][0031]其中,x'为变换后的数据,x为原始数据,k为一个随机整数,N为数据的长度,%为取余函数。
[0032]进一步地,对于地址类数据在进行脱敏时采用截断的方式,保留地址的区市级别,将其余部分截掉。
[0033]实施本专利技术具有如下有益效果:本专利技术使用擅长进行图像处理的CNN网络作为敏感数据的预测模型,为敏感数据的预测提供了一种新的思路,相比于该领域内其他脱敏方法,本专利技术能够处理大量数据,拥有更高的处理效率和更强大的处理能力,具有实用意义。
附图说明
[0034]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本专利技术实施例一种基于卷积神经网络的电力量测数据脱敏方法的流程示意
图。
[0036]图2是本专利技术实施例中卷积神经网络模型的结构及原理示意图。
[0037]图3是本专利技术实施例中数据脱敏的原理示意图。
具体实施方式
[0038]以下各实施例的说明是参考附图,用以示例本专利技术可以用以实施的特定实施例。
[0039]请参照图1所示,本专利技术实施例提供一种基于卷积神经网络的电力量测数据脱敏方法,包括:
[0040]步骤S1,将未脱敏的电力量测数据输入训练好的卷积神经网络模型中,得到所述电力量测数据中的敏感数据集;
[0041]步骤S2,对所述敏感数据集中的敏感数据进行聚类;
[0042]步骤S3,采用相应的脱敏模型对各个聚类的敏感数据进行脱敏。
[0043]具体地,本实施例在对电力量测数据进行脱敏以前,预先定义电力量测数据的实体标签,以便后续流程根据实体标签来对电力量测数据进行分割。
[0044]实体标签标记了包括用户的姓名、公司名称、用户的身份证信息、银行卡号、电话号码、用户每时刻的用电量信息和用户地址信息。实体标签定义如表1所示:
[0045]表1实体标签定义
[0046][0047]在对电力量测数据进行敏感数据的识别和分类处理时,预处理是非常重要的,由于算法只能识别结构化的数据,所以,在进行脱敏处理之前需要将非结构化的文字转化成为算法能够识别的结构化数据,将数据用词向量的形式表示出来。数据预处理的质量将决定着最终敏感数据识别和分类的质量。对数据依据实体标签进行分词能够使每类敏感数据在进行向量转化时得到长度相似的特征向量,便于进行卷积分类。
[0048]使用预定义的实体标签对电力量测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的电力量测数据脱敏方法,其特征在于,包括:步骤S1,将未脱敏的电力量测数据输入训练好的卷积神经网络模型中,得到所述电力量测数据中的敏感数据集;步骤S2,对所述敏感数据集中的敏感数据进行聚类;步骤S3,采用相应的脱敏模型对各个聚类的敏感数据进行脱敏。2.根据权利要求1所述的方法,其特征在于,所述步骤S1具体包括:所述训练好的卷积神经网络模型的输入层对输入的未脱敏的电力量测数据进行预处理,得到数据向量矩阵;在卷积层对数据向量矩阵进行卷积,数据经卷积运算和激活函数运算之后得到多个特征映射,提取出特征向量;特征向量进入池化层进行池化;数据进入全连接层进行拟合;输出预测的电力量测数据中的敏感数据集。3.根据权利要求2所述的方法,其特征在于,所述预处理具体包括:使用预定义的实体标签对电力量测数据进行标记,标记后再根据实体标签对电力量测数据进行分割,分割之后使用word2vec对数据进行转换,将文本信息转换为数据向量矩阵。4.根据权利要求2所述的方法,其特征在于,提取特征向量的方式为:x'=f(∑x
·
k+b)其中,x'是输出特征,x是输入特征,k是权值,b是加性偏置,f(*)是激活函数。5.根据权利要求4所述的方法,其特征在于,池化层将卷积层输出的特征向量根据语义相似度进行合并:x'=f(β
·
pooli...

【专利技术属性】
技术研发人员:刘涛马越李伟华何智帆姜和芳陈晓伟刘星廷曾璐琨
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1