非交互式电力市场数据发布方法、装置、设备及存储介质制造方法及图纸

技术编号:37622607 阅读:11 留言:0更新日期:2023-05-18 12:14
本申请公开了一种非交互式电力市场数据发布方法、装置、设备及存储介质,该方法包括:实现对电力市场交易混合数据集的属性聚类与低相关性聚类;重新计算聚类中心与数据聚类类别;实现基于相关拉普拉斯机制和指数机制的差分隐私;训练ElasticNet回归算法模型生成预测模型。该方法利用聚类算法、差分隐私技术和机器学习共同实现电力市场非交互式混合数据的隐私保护发布,进而提出了一种基于差分隐私的非交互式电力市场数据的发布方法,旨在电力市场非交互式混合数据集差分隐私场景下,保证电力市场大数据的隐私性和可用性达到动态平衡的状态。的状态。的状态。

【技术实现步骤摘要】
非交互式电力市场数据发布方法、装置、设备及存储介质


[0001]本申请涉及数据处理领域,特别涉及一种非交互式电力市场数据发布方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着国家发改委、国家能源局印发《关于进一步做好电力现货市场建设试点工作的通知》,力求加快完善电力市场体系,电力市场化改革已经成为世界电力发展的共同趋势。而电力市场信息也正在成为一项非常关键的商业资产。随着电力行业日趋智能化,电力市场信息必将成为各类企业取得竞争优势的关键,这也意味着企业的竞争力将会越来越多地取决于利用电力市场信息、应用分析和实施新技能的能力。在电力行业的每个细分领域,电力市场信息及其转化为商业价值的能力很快都将显现出越来越重要的作用。
[0003]随着智能电网和大数据技术的发展与应用,利用发布的电力市场交易大数据对电力行业的状态进行数据挖掘和分析的数据共享模式,已经成为日益重要的电力信息化时代标杆之一。然而,数据共享模式明显是一把具有利弊的双刃剑,一方面数据共享带来了十足的便捷;但另一方面,数据共享也会带来个人隐私数据泄露的风险,因此有关隐私保护电力市场信息数据发布收到人们广泛关注。
[0004]传统的隐私保护手段多种多样,但它们仍有各自较为明显的缺点。匿名技术提供了隐私保护和数据的可用性,但它仍然会受到同质性和背景知识攻击的影响。阻断方法受到信息损失的影响,随机扰动技术不能提供数据的较强可用性。密码学技术提供了隐私保护,但不提供数据的可用性,而且需要更多的计算开销。冷凝和随即响应技术可以保护隐私,但它们也会同样地造成部分信息的损失。
[0005]因此,如何对非交互式电力市场数据进行合适的隐私保护,是本领域技术人员亟待解决的问题。

技术实现思路

[0006][0007]本申请的目的是提供一种非交互式电力市场数据发布方法、装置、电子设备及计算机可读存储介质。
[0008]为实现上述目的,本申请在第一方面提供了一种非交互式电力市场数据发布方法,该方法包括:根据预设的元组属性差异度计算方式对电力市场交易的原始混合数据集按k

prototype聚类算法进行聚类,并根据原始混合数据集和数据集的相关性生成相关性较低的数值型属性数据集和分类型属性数据集;根据聚类结果对每个数值型属性数据集聚类计算聚类中心,并将分类型属性数据集生成属性值集合,且遍历每一个数据记录确定其所属的聚类类别;根据差分隐私性质利用查询函数询问数值型属性数据集敏感度,并将数值型属性数据集的数值型属性替换为聚类中心值且采用相关拉普拉斯机制添加噪声;根据差分隐私性质对分类型属性数据集采用指数机制选择输出属性值集合;将数值型属性数据
集的聚类中心值的查询集和满足差分隐私的查询集作为机器学习的训练样本集,并利用训练样本集训练ElasticNet回归算法模型,生成预测模型;将原始混合数据集输入到预测模型中,并接收预测模型输出的满足差分隐私的原始混合数据集的目标查询集,且对目标查询集进行数据发布。
[0009]为实现上述目的,本申请在第二方面提供了一种非交互式电力市场数据发布装置,该装置包括:数据集拆分单元,用于根据预设的元组属性差异度计算方式对电力市场交易的原始混合数据集按k

prototype聚类算法进行聚类,并根据原始混合数据集和数据集的相关性生成相关性较低的数值型属性数据集和分类型属性数据集;聚类类别确定单元,用于根据聚类结果对每个数值型属性数据集聚类计算聚类中心,并将分类型属性数据集生成属性值集合,且遍历每一个数据记录确定其所属的聚类类别;查询及噪声添加单元,用于根据差分隐私性质利用查询函数询问数值型属性数据集敏感度,并将数值型属性数据集的数值型属性替换为聚类中心值且采用相关拉普拉斯机制添加噪声;指数机制处理单元,用于根据差分隐私性质对分类型属性数据集采用指数机制选择输出属性值集合;预测模型生成单元,用于将数值型属性数据集的聚类中心值的查询集和满足差分隐私的查询集作为机器学习的训练样本集,并利用训练样本集训练ElasticNet回归算法模型,生成预测模型;数据发布单元,用于将原始混合数据集输入到预测模型中,并接收预测模型输出的满足差分隐私的原始混合数据集的目标查询集,且对目标查询集进行数据发布。
[0010]为实现上述目的,本申请在第三方面提供了一种电子设备,该电子设备包括:
[0011]存储器,用于存储计算机程序;
[0012]处理器,用于在执行存储于存储器上的计算机程序时可实现如上述第一方面所描述的非交互式电力市场数据发布方法的各步骤。
[0013]为实现上述目的,本申请在第四方面提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面的非交互式电力市场数据发布的各步骤。
[0014]通过应用本申请所提供的非交互式电力市场数据发布方案,可实现如下技术效果:
[0015]1)利用k

prototype聚类算法,将原始电力市场交易混合数据集聚类成数值型属性数据集和分类型属性数据集,便于之后对其进行分类分机制差分隐私保护;2)将非交互式差分隐私数据发布问题转化成为具有差分隐私约束的机器学习问题,利用改进k

prototype聚类算法,并通过对数据集中的分类和数值属性使用不同的方法计算属性差异度,将可能相关的类似记录分组,降低了差分隐私敏感度,减少了添加到查询结果的噪声,有效解决了引入噪声量过大导致数据可用性降低的问题;3)利用相关拉普拉斯机制进行相关时间序列数据发布的差分隐私技术,其核心思想是利用序列不可区分性;4)应用ElasticNet回归算法训练样本产生预测模型,通过预测模型发布满足差分隐私的数据集,而不是直接从原始数据集得出,这使得攻击者无法通过对比发布数据差异来获得用户信息,安全性进一步提高;5)预测模型的隐私级别由在训练时消耗的隐私预算确定,因此可以通过控制隐私预算使得添加的噪声趋于中间值,即不会过大也不会过小,在最大限度保护数据的隐私时,维持数据的可用性。
[0016]本申请同时还提供了一种非交互式电力市场数据发布装置、电子设备及计算机可
读存储介质,具有上述有益效果,在此不再赘述。
附图说明
[0017]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0018]图1为本申请实施例提供的一种非交互式电力市场数据发布方法的流程图;
[0019]图2为本申请实施例提供的另一种非交互式电力市场数据发布方法的流程图;
[0020]图3为本申请实施例提供的一种采用相关拉普拉斯机制添加噪声的示意图;
[0021]图4为本申请实施例提供的一种非交互式电力市场数据发布装置的结构框图。...

【技术保护点】

【技术特征摘要】
1.一种非交互式电力市场数据发布方法,其特征在于,包括:根据预设的元组属性差异度计算方式对电力市场交易的原始混合数据集按k

prototype聚类算法进行聚类,并根据所述原始混合数据集和数据集的相关性生成相关性较低的数值型属性数据集和分类型属性数据集;根据聚类结果对每个所述数值型属性数据集聚类计算聚类中心,并将所述分类型属性数据集生成属性值集合,且遍历每一个数据记录确定其所属的聚类类别;根据差分隐私性质利用查询函数询问所述数值型属性数据集敏感度,并将所述数值型属性数据集的数值型属性替换为聚类中心值且采用相关拉普拉斯机制添加噪声;根据差分隐私性质对所述分类型属性数据集采用指数机制选择输出属性值集合;将所述数值型属性数据集的聚类中心值的查询集和满足差分隐私的所述查询集作为机器学习的训练样本集,并利用所述训练样本集训练ElasticNet回归算法模型,生成预测模型;将所述原始混合数据集输入到所述预测模型中,并接收所述预测模型输出的满足差分隐私的原始混合数据集的目标查询集,且对所述目标查询集进行数据发布。2.根据权利要求1所述的方法,其特征在于,所述根据所述原始混合数据集和数据集的相关性生成相关性较低的数值型属性数据集和分类型属性数据集,包括:针对具有不同类型属性的原始混合数据集中的数据,采用不同的属性差异度计算方法计算属性差异度;根据所述属性差异度输出相关性较低的数值型属性数据集和分类型属性数据集。3.根据权利要求1所述的方法,其特征在于,还包括:针对具有不同类型属性的原始混合数据集,采取不同的差分隐私机制完成对数据的隐私保护。4.根据权利要求1所述的方法,其特征在于,所述采用相关拉普拉斯机制添加噪声,包括:使用四个通过线性系统的高斯白噪声序列来生成相关的拉普拉斯噪声序列。5.一种非交互式电力市场数据发布装置,其特征在于,包括:数据集拆分单元,用于根据预设的元组属性差异度计算方式对电力市场交易的原始混合数据集按k

prototype聚类算法进行聚类,并根据所述原始混合数据集和数据集的相关性生成相关性较低的数值型属性数据集和分类型属性数据集;聚类类别确定单元,用于根据聚类结果对每个...

【专利技术属性】
技术研发人员:骆希赵雯黄恒孜李知艺朱毛宋则豪
申请(专利权)人:浙江电力交易中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1