一种基于同态加密的数据血缘管理方法技术

技术编号:39056432 阅读:15 留言:0更新日期:2023-10-12 19:49
本发明专利技术涉及一种基于同态加密的数据血缘管理方法,通过采集血缘元数据;记录采集的血缘元数据信息;对采集的血缘元数据信息中数据进行加密处理;解析加密处理的血缘元数据;最终存储解析加密后的数据血缘实现了数据血缘管理。本发明专利技术在数据血缘的采集层实现采集数据链路中(数据资产目录)元数据接口,提取数据血缘关键信息,采集门户班组数据集元数据信息,提取数据血缘关键信息,采集国网云数据组件元仓接口,提取数据仓库、管理组件等数据血缘关键信息,将以上采集信息进行同态加密之后再加载至DWS采集信息汇总表再进行后续操作。载至DWS采集信息汇总表再进行后续操作。载至DWS采集信息汇总表再进行后续操作。

【技术实现步骤摘要】
一种基于同态加密的数据血缘管理方法


[0001]本专利技术属于数据中台
,尤其是一种基于同态加密的数据血缘管理方法。

技术介绍

[0002]随着数据中台建设规模和数据体量的不断扩大,当前系统的身份鉴别信息、敏感的系统管理数据和敏感的监测分析数据在传输、存储、处理过程中,存在多处数据隐私泄露的风险,亟需构建数据血缘分析能力,进行加密或使用专用的协议或安全通信协,为实现后续数据中台的高质量运行提供有力的保障。
[0003]数据血缘分析工具,整体包含血缘元数据采集、血缘元数据解析、数据血缘存储、数据血缘应用管理后台四部分,解析遵从国家电网公司应用架构设计,具体包括血缘采集、血缘解析、血缘存储三个应用模块的设计开发,建设在数据血缘分析功能,有效实现新型重大业务系统数据流转状况的全面分析,为国网相关电力公司决策层直观、全面的掌握运营过程中各个环节可能存在的隐患,提供可行的整体的技术实力和先进的管理水平。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的不足,提出一种基于同态加密的数据血缘管理方法,实现数据中台各链路信息获取,及时了解数据中台链路运行状态时,针对当前系统的身份鉴别信息、敏感的系统管理数据和敏感的监测分析数据在传输、存储、处理过程中,存在多处数据隐私泄露的风险,亟需构建数据血缘分析能力,提出一种基于同态加密的数据血缘管理研究方法。
[0005]本专利技术解决其技术问题是采取以下技术方案实现的:
[0006]一种基于同态加密的数据血缘管理方法,包括以下步骤:<br/>[0007]步骤1、采集血缘元数据;
[0008]步骤2、记录采集的血缘元数据信息;
[0009]步骤3、对采集的血缘元数据信息中数据进行加密处理;
[0010]步骤4、解析加密处理的血缘元数据;
[0011]步骤5、存储解析加密后的数据血缘。
[0012]而且,所述步骤1包括以下步骤:
[0013]步骤1.1、识别并分析数据源:识别数据源中数据的类型、来源和格式,对数据源进行分析,理解其层次结构、数据类型、字段属性和数据关联特点并进行血缘元数据采集;
[0014]步骤1.2、数据血缘采集:在数据血缘采集层实现采集数据链路中元数据接口,提取数据血缘关键信息,采集门户班组数据集元数据信息,提取数据血缘关键信息,采集数据组件元仓接口,提取数据仓库、管理组件等数据血缘关键信息,将采集信息加载至DWS采集信息汇总表;
[0015]步骤1.3、处理与清洗数据:在进行血缘元数据采集之后,对数据源中数据进行处理和转换,使转换后的数据适应数据血缘分析的需要;
[0016]而且,所述步骤2包括以下步骤:
[0017]步骤2.1、记录数据的血缘信息:记录数据来源,其中包括数据的采集、输入和导入方式,以及数据存储的位置和格式;
[0018]步骤2.2、记录数据去向:包括数据的输出、导出和共享方式,以及数据存储的位置和格式;
[0019]步骤2.3、记录数据的中间处理过程:包括数据在传递和使用过程中的各种转换、加工和计算中间处理过程。
[0020]而且,所述步骤3包括以下步骤:
[0021]步骤3.1、密钥生成:KeyGen()

(pk,sk)
[0022]随机选取两个质数p,q,且满足gcd(pq,(p

1)(q

1))=1;
[0023]计算n=pq,λ=lcm(p

1,q

1),定义解密函数
[0024]随机选取一个正整数g&lt;n2,并计算μ=(L(g
λ
mod n2))
‑1mod n;
[0025]公钥pk为(n,g),私钥sk为(λ,μ);
[0026]其中,KeyGen()是密钥生成函数,pk为最终生成的公钥,sk为私钥,gcd()函数返回其最大公约数,lcm()函数返回其最小公倍数;
[0027]步骤3.2、加密:Enc(pk,m)

c
[0028]随机选取一个整数r,其满足0&lt;r&lt;n,r在n2的剩余系下存在乘法逆元,一种充分条件为r和n互质;
[0029]计算密文c=g
m
r
n mod n2;
[0030]其中,Enc()是加密函数,pk为步骤(1)生成的公钥,m是明文数据,c是密文数据,Z表示整数,下标表示该整数集合里有多少个元素;
[0031]步骤3.3、解密:Dec(sk,c)

m
[0032]计算明文m=L(c
λ
mod n2)*μmod n.
[0033]其中,Dec()是解密函数,sk是密钥生成函数KeyGen()生成的私钥,c是密文数据,m是明文数据。
[0034]而且,所述步骤4包括以下步骤:
[0035]步骤4.1、基于部署血缘解析工具的服务器读取DWS采集信息汇总表,使用血缘解析工具解析数据链路元数据获取对应资产目录血缘关系数据,以文本的形式存放血缘解析结果;
[0036]步骤4.2、基于部署血缘解析工具的服务器读取DWS采集信息汇总表,使用血缘解析工具解析数据组件元仓数据,获取数据组件元仓血缘关系数据,以文本的形式存放血缘解析结果;
[0037]步骤4.3、基于部署血缘解析工具的服务器读取DWS采集信息汇总表,使用血缘解析工具解析数据中台任务中元数据,获取任务血缘关系数据,以文本的形式存放血缘解析结果;
[0038]步骤4.4、基于部署血缘解析工具的服务器读取DWS采集信息汇总表,使用血缘解析工具解析数据中台数据服务中元数据,获取数据服务血缘关系数据,解析报表工具元数据,获取报表工具血缘关系数据。对门户班组数据集进行表级、数据集的关系解析,获取数
据集关系血缘数据,以文本的形式存放血缘解析的上下游关系结果。
[0039]而且,所述步骤5的具体实现方法为:步骤4中血缘解析结果通过DWS数仓批量加载工具完成入库操作,根据血缘元数据中不同的ID编号和加载时间进行级联关系标记,基于递归算法将结构化血缘惯性系数据进行表、字段、函数解析和拼接,生成基础血缘关系数据,基于血缘数据进行迭代计算解析生成流向数据,基于文本格式构建数据库、表、字段、函数的流向数据,生成血缘关系的库、表、字段、函数、数据分层、注释、属性、场景信息、函数描述、字段注释、指向关系等图数据语言,对应生成血缘关系的门户数据集、DGC

DLF、DGC

DLM关系图数据库语言。
[0040]本专利技术的优点和积极效果是:
[0041]本专利技术通过采集数据血缘;记录采集的血缘元数据信息;对采集的血缘元数据信息中数据进行加密处理;解析加密处理的数据血缘;最终存储解析加密后的数据血缘实现了数据血缘管理。本专利技术的血缘解析结果通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于同态加密的数据血缘管理方法,其特征在于:包括以下步骤:步骤1、采集血缘元数据;步骤2、记录采集的血缘元数据信息;步骤3、对采集的血缘元数据信息中数据进行加密处理;步骤4、解析加密处理的血缘元数据;步骤5、存储解析加密后的数据血缘。2.根据权利要求1所述的一种基于同态加密的数据血缘管理方法,其特征在于:所述步骤1包括以下步骤:步骤1.1、识别并分析数据源:识别数据源中数据的类型、来源和格式,对数据源进行分析,理解其层次结构、数据类型、字段属性和数据关联特点并进行血缘元数据采集;步骤1.2、血缘元数据采集:在数据血缘采集层实现采集数据链路中元数据接口,提取数据血缘关键信息,采集门户班组数据集元数据信息,提取数据血缘关键信息,采集数据组件元仓接口,提取数据仓库、管理组件等数据血缘关键信息,将采集信息加载至DWS采集信息汇总表;步骤1.3、处理与清洗数据:在进行血缘元数据采集之后,对数据源中数据进行处理和转换,使转换后的数据适应数据血缘分析的需要。3.根据权利要求1所述的一种基于同态加密的数据血缘管理方法,其特征在于:所述步骤2包括以下步骤:步骤2.1、记录血缘元数据信息:记录数据来源,其中包括数据的采集、输入和导入方式,以及数据存储的位置和格式;步骤2.2、记录数据去向:包括数据的输出、导出和共享方式,以及数据存储的位置和格式;步骤2.3、记录数据的中间处理过程:包括数据在传递和使用过程中的各种转换、加工和计算中间处理过程。4.根据权利要求1所述的一种基于同态加密的数据血缘管理方法,其特征在于:所述步骤3包括以下步骤:步骤3.1、密钥生成:KeyGen()

(pk,sk)随机选取两个质数p,q,且满足gcd(pq,(p

1)(q

1))=1;计算n=pq,λ=lcm(p

1,q

1),定义解密函数随机选取一个正整数g&lt;n2,并计算μ=(L(g
λ
mod n2))
‑1mod n;公钥pk为(n,g),私钥sk为(λ,μ);其中,KeyGen()是密钥生成函数,pk为最终生成的公钥,sk为私钥,gcd()函数返回其最大公约数,lcm()函数返回其最小公倍数;步骤3.2、加密:Enc(pk,m)

c随机选取一个整...

【专利技术属性】
技术研发人员:郝美薇张旭于海涛董阳包永迪颜阳段晨旭王凯闫波孙健
申请(专利权)人:国家电网有限公司国网天津市电力公司信息通信公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1