基于时序随机映射的差分隐私数据脱敏方法及相关装置制造方法及图纸

技术编号:37374856 阅读:35 留言:0更新日期:2023-04-27 07:18
本申请公开了一种基于时序随机映射的差分隐私数据脱敏方法及相关装置,包括:获取电力交易中心需要脱敏的各类目标时序数据,并利用基于动态时间弯曲距离度量的k

【技术实现步骤摘要】
基于时序随机映射的差分隐私数据脱敏方法及相关装置


[0001]本申请涉及数据处理领域,特别涉及一种基于时序随机映射的差分隐私数据脱敏方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]近年来,国家《网络安全法》和《数据安全法》相继颁布,电力行业高度重视数据安全工作,业务部门利用数据权限管控、脱敏、水印、加密等技术手段开展了一系列数据防护工作,但数据交换及外发仍存在未全程审计及数据安全不可控的风险。随着电力市场建设的展开,电力市场试点等重点内容在若干省(区)取得重要突破,各省相继印发本地市场规则,市场化交易密集开展,形成了多周期、多品种的交易体系。其中市场中流动的电力市场信息是支撑电力市场发展至关重要的基础,但这些数据当前都会受到严重的隐私泄露问题。一方面,电力运营系统依据数据脱敏工作中,导出的数据没有经过混淆、添加数据水印标记等安全防护管控措施,增加了客户敏感信息暴露的可能,一旦数据外泄无法快速定位溯源。另一方面,电力运营系统存在大量用电客户个人信息等重要数据,敏感度高,涉及范围广。这些数据向电网企业各专业、各基层单位和外部合作单本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于时序随机映射的差分隐私数据脱敏方法,其特征在于,包括:获取电力交易中心需要脱敏的各类目标时序数据,并利用基于动态时间弯曲距离度量的k

medoids聚类算法对所述目标时序数据进行聚类,得到不同簇的时序数据集;基于所述目标时序数据的最大压缩比,计算出同簇中的不同目标时序数据对应的窗口值大小,并确定所有所述目标时序数据的压缩比平均值,且将所述压缩比平均值作为脱敏时设定的目标窗口大小;基于预先确定的目标时序数据的安全防护需求等级,确定差分隐私所需要的隐私预算,并根据所述目标窗口值大小和时序随机映射的差分隐私脱敏方式对所述目标时序数据进行处理,得到经过时序脱敏后的电力市场主体数据。2.根据权利要求1所述的方法,其特征在于,所述利用基于动态时间弯曲距离度量的k

medoids聚类算法对所述目标时序数据进行聚类,包括:随机选择k个对象作为初始的聚类中心;反复使用非聚类中心点来替代对所述目标时序数据进行聚类的初始的聚类中心;计算不同聚类中心各自的代价函数,并基于根据各所述代价函数确定出的相异度确定最终的聚类中心。3.根据权利要求1所述的方法,其特征在于,所述基于所述目标时序数据的最大压缩比,计算出同簇中的不同目标时序数据对应的窗口值大小,包括:按照下述公式进行计算:其中,F为时间序列数据变化频率,n为一个序列中含有的数据点数,x
i
表示序列中的第i个数据点,w为最大压缩比,k为标准常数,θ为允许误差。默认θ=0.05、k=100。4.根据权利要求1

3任一项所述的方法,其特征在于,所述根据所述目标窗口值大小和时序随机映射的差分隐私脱敏方式对所述目标时序数据进行处理,包括:初始化扰乱序列为空,并选择一条时间序列作为原始序列,并将大小为k的窗口置于原始序列与所述扰乱序列首端;计算映射序列窗口中为位置为空的位数,并记为c;比较数值c与阈值c0的大小,若c>c0,则原始序列窗口首端的位点x
i
将以1/c的概率映射到所述扰乱序列窗口中数值为空的任意一个位点上;若c>c0不成立且所述扰乱序列的窗口首端的位置为空,则优先映射;若c>c0不成立且所述扰乱序列的窗口首端的位置不为空,则以1/c0的概率映射到所述扰乱序列窗口为空的任意一个位点上。5.一种基于时序随机映射的差分隐私数据脱敏装置,其特征在于,包括:聚类处理单元,用于获取电力交易中心需要脱敏的各类目标时序数据,并利...

【专利技术属性】
技术研发人员:骆希赵雯黄恒孜李知艺朱毛宋则豪
申请(专利权)人:浙江电力交易中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1