一种基于图学习的虚拟电厂用户敏感数据识别方法及装置制造方法及图纸

技术编号:36812581 阅读:16 留言:0更新日期:2023-03-09 00:54
本发明专利技术公开了一种基于图学习的虚拟电厂用户敏感数据识别方法及装置,该方法包括:获取待识别用户数据;根据待识别用户数据中关键词的关系生成待识别图网络;将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。通过实施本发明专利技术,实现了通过图学习的方法生成最小连通支配集,降低了后续图匹配的复杂度,提高匹配速度,相比传统敏感识别方法具有更高的效率。相比传统敏感识别方法具有更高的效率。相比传统敏感识别方法具有更高的效率。

【技术实现步骤摘要】
一种基于图学习的虚拟电厂用户敏感数据识别方法及装置


[0001]本专利技术涉及电力数据安全
,具体涉及一种基于图学习的虚拟电厂用户敏感数据识别方法及装置。

技术介绍

[0002]在能源互联网蓬勃发展的大环境下,能源系统中出现大量产消者,大量分布式资源的随机性和波动性增加了电网复杂性和管控难度,对电网的安全、可靠和经济运行产生重大影响。复杂虚拟电厂技术利用先进的传感、控制技术,有效地聚合和调度新能源发电、储能等分布式资源,在参与辅助服务市场获取收益的同时,为电网提供灵活性,提升电网安全水平,降低电网运行成本与投资成本,是多能流综合能量管理系统中的重要模块。
[0003]因此,复杂虚拟电厂用户数据的安全保护成为国网数据安全防护工作的重要基础。随着各类数据保护法的发布,明确提出了数据识别要求。近年来,电网公司围绕数据识别积极做出一系列初步探索,初步形成了识别方法和实践操作基础。但同时,目前识别工作主要依赖人工方式,存在着效率低、准确性差且难以落地等诸多问题。
[0004]复杂虚拟电厂用户数据呈现体量大、类型多和涉密程度高等特点,包含大量对国家、社会及公司利益造成影响的商密数据和个人信息数据。为更好理清重要数据、明确数据风险、强化数据安全防护,近年来电力行业围绕复杂虚拟电厂用户敏感数据识别积极做出一系列初步探索,先后发布各类文件,提出了电力数据识别总体要求,并基于数据表、字段描述,通过人工梳理方式,发布了共享负面清单目录,推进电力数据内部共享融通。
[0005]因此,如何同时满足复杂虚拟电厂用户敏感数据快速识别的需求,是复杂虚拟电厂用户敏感数据识别方案目前亟待解决的关键问题。

技术实现思路

[0006]有鉴于此,本专利技术实施例提供了涉及一种基于图学习的虚拟电厂用户敏感数据识别方法及装置,以解决现有技术中如何同时满足复杂虚拟电厂用户敏感数据快速识别的技术问题。
[0007]本专利技术提出的技术方案如下:
[0008]本专利技术实施例第一方面提供一种基于图学习的虚拟电厂用户敏感数据识别方法,包括:获取待识别用户数据;根据待识别用户数据中关键词的关系生成待识别图网络;将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。
[0009]可选地,根据待识别用户数据中关键词的关系生成待识别图网络,包括:基于词频统计对待识别用户数据进行分词处理,生成待识别用户数据对应的关键词列表;遍历待识别用户数据,提取待识别用户数据中与所述关键词列表匹配的词汇以及词汇之间的关系,
生成待识别图网络,待识别图网络包括节点和边。
[0010]可选地,所述图卷积神经网络模型采用如下方式训练:获取多个图网络,图网络包括节点和边;采用最小生成树普利姆算法生成每个图网络的最小连通支配集;基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,得到预先训练的图卷积神经网络模型。
[0011]可选地,基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,包括:采用多个图网络中每个节点的度数作为节点特征矩阵;将图网络中属于最小连通支配集的节点标记为1,不属于的节点标记为0,得到节点的标签值;基于所述节点特征矩阵和所述节点的标签值对图卷积神经网络进行训练,图卷积神经网络中采用relu作为激活函数,卷积层中包括dropout,采用对数似然函数作为损失函数。
[0012]可选地,基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图,包括:获取待识别图网络对应的最小连通支配集中任意两个节点;判断待识别图网络中对应两个节点之间在待识别图网络中是否存在一条边;若存在,在两个节点中加上边;重复上述步骤,直至遍历完成最小连通支配集中的所有节点,得到待识别图网络的简化图。
[0013]可选地,将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果,包括:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图;计算待识别图网络的简化图和标准敏感级别数据对应的简化图中的节点个数;基于最大公共子图和节点个数中的最大值进行匹配度计算,将待识别用户数据归为匹配度最高的标准敏感级别数据对应的敏感结果。
[0014]可选地,计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图,包括:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的共有节点;基于所述共有节点计算待识别图网络的简化图和标准敏感级别数据对应的简化图共有边;基于所述共有节点和共有边确定最大公共子图。
[0015]本专利技术实施例第二方面提供一种基于图学习的虚拟电厂用户敏感数据识别装置,包括:数据获取模块,用于获取待识别用户数据;图网络生成模块,用于根据待识别用户数据中关键词的关系生成待识别图网络;支配集生成模块,用于将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;简化图生成模块,用于基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;分类分级模块,用于将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。
[0016]可选地,图网络生成模块具体用于:基于词频统计对待识别用户数据进行分词处理,生成待识别用户数据对应的关键词列表;遍历待识别用户数据,提取待识别用户数据中与所述关键词列表匹配的词汇以及词汇之间的关系,生成待识别图网络,待识别图网络包括节点和边。
[0017]可选地,所述图卷积神经网络模型采用如下方式训练:获取多个图网络,图网络包括节点和边;采用最小生成树普利姆算法生成每个图网络的最小连通支配集;基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,得到预先训练的图卷积神经网络模型。
[0018]可选地,基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,
包括:采用多个图网络中每个节点的度数作为节点特征矩阵;将图网络中属于最小连通支配集的节点标记为1,不属于的节点标记为0,得到节点的标签值;基于所述节点特征矩阵和所述节点的标签值对图卷积神经网络进行训练,图卷积神经网络中采用relu作为激活函数,卷积层中包括dropout,采用对数似然函数作为损失函数。
[0019]可选地,简化图生成模块具体用于:获取待识别图网络对应的最小连通支配集中任意两个节点;判断待识别图网络中对应两个节点之间在待识别图网络中是否存在一条边;若存在,在两个节点中加上边;重复上述步骤,直至遍历完成最小连通支配集中的所有节点,得到待识别图网络的简化图。
[0020]可选地,分类分级模块具体用于:计算待识别图网络的简化图和标准敏感级别数据对应的简化图的最大公共子图;计算待识别图网络的简化图和标准敏感级别数据对应的简化图中的节点个数;基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图学习的虚拟电厂用户敏感数据识别方法,其特征在于,包括:获取待识别用户数据;根据待识别用户数据中关键词的关系生成待识别图网络;将待识别图网络输入至预先训练的图卷积神经网络模型,得到待识别图网络对应的最小连通支配集;基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图;将待识别图网络的简化图和标准敏感级别数据对应的简化图进行匹配度计算,得到待识别用户数据的敏感识别结果。2.根据权利要求1所述的基于图学习的虚拟电厂用户敏感数据识别方法,其特征在于,根据待识别用户数据中关键词的关系生成待识别图网络,包括:基于词频统计对待识别用户数据进行分词处理,生成待识别用户数据对应的关键词列表;遍历待识别用户数据,提取待识别用户数据中与所述关键词列表匹配的词汇以及词汇之间的关系,生成待识别图网络,待识别图网络包括节点和边。3.根据权利要求1所述的基于图学习的虚拟电厂用户敏感数据识别方法,其特征在于,所述图卷积神经网络模型采用如下方式训练:获取多个图网络,图网络包括节点和边;采用最小生成树普利姆算法生成每个图网络的最小连通支配集;基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,得到预先训练的图卷积神经网络模型。4.根据权利要求3所述的基于图学习的虚拟电厂用户敏感数据识别方法,其特征在于,基于多个图网络和对应的最小连通支配集对图卷积神经网络进行训练,包括:采用多个图网络中每个节点的度数作为节点特征矩阵;将图网络中属于最小连通支配集的节点标记为1,不属于的节点标记为0,得到节点的标签值;基于所述节点特征矩阵和所述节点的标签值对图卷积神经网络进行训练,图卷积神经网络中采用relu作为激活函数,卷积层中包括dropout,采用对数似然函数作为损失函数。5.根据权利要求1所述的基于图学习的虚拟电厂用户敏感数据识别方法,其特征在于,基于待识别图网络对应的最小连通支配集生成待识别图网络的简化图,包括:获取待识别图网络对应的最小连通支配集中任意两个节点;判断待识别图网络中对应两个节点之间在待识别图网络中是否存在一条边;若存在,在两个节点中加上边;重复上述步...

【专利技术属性】
技术研发人员:石聪聪费稼轩杨如侠黄兴德余涛
申请(专利权)人:国网上海市电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1