隐私数据处理方法和装置制造方法及图纸

技术编号:30900497 阅读:14 留言:0更新日期:2021-11-22 23:44
本说明书实施例公开了一种隐私数据处理方法和装置。所述方法包括:获取对源数据库执行的涉及隐私数据的结构化查询SQL语句和与所述隐私数据相关的辅助信息;对获取的SQL语句进行语义解析,以得到源数据库中的隐私数据之间的血缘关系信息,所述血缘关系信息用于指示隐私数据所在的字段之间的关联关系、隐私数据所在的数据表之间的关联关系以及所述字段和所述数据表之间的关联关系;基于所述血缘关系信息,在目标图数据库中创建图谱数据模式,所述图谱数据模式包括多个节点和连接不同节点的边,所述节点表示字段或数据表,所述边表示相连接的节点之间的关联关系;基于所述图谱数据模式,将所述辅助信息存储至所述目标图数据库中。库中。库中。

【技术实现步骤摘要】
隐私数据处理方法和装置


[0001]本文件涉及计算机
,尤其涉及一种隐私数据处理方法和装置。

技术介绍

[0002]隐私数据在不同业务单元之间流转的过程中,其加工使用可能会引发合规的问题,因而需要对隐私数据进行管理,以便能够快速的对隐私数据进行溯源、纠错等。
[0003]目前,传统的隐私数据管理方案大多采用正则表达式、语法树解析或者相关关键词匹配的方式获取隐私数据之间的上下游关系,并通过关系型数据库对隐私数据之间的上下游关系进行存储,进而使用表查询方式来实现相关隐私数据的管理和回溯功能。但是,这种方式本质上是一种面向“点”的数据管理方式,管理粒度较粗,不同隐私数据之间是割裂的,且当隐私数据之间存在多层级的关系时,对隐私数据来源的回溯过程存在较高的复杂性。
[0004]基于此,当前亟需一种能够实现对隐私数据进行精细化且高效管理的隐私数据处理方案。

技术实现思路

[0005]本说明书实施例目的是提供一种隐私数据处理方法和装置,以能够实现对隐私数据的精细化且高效管理。
[0006]为了实现上述目的,本说明书实施例采用下述技术方案:
[0007]第一方面,提供一种隐私数据处理方法,包括:
[0008]获取对源数据库执行的涉及隐私数据的结构化查询SQL语句和与所述隐私数据相关的辅助信息,所述辅助信息用于描述所述隐私数据所在的字段及数据表的属性;
[0009]对获取的SQL语句进行语义解析,以得到所述源数据库中的隐私数据之间的血缘关系信息,所述血缘关系信息用于指示所述隐私数据所在的字段之间的关联关系、所述隐私数据所在的数据表之间的关联关系以及所述字段和所述数据表之间的关联关系;
[0010]基于所述血缘关系信息,在目标图数据库中创建表征所述隐私数据之间的血缘关系的图谱数据模式,所述图谱数据模式包括多个节点和连接不同节点的边,所述节点表示字段或数据表,所述边表示相连接的节点之间的关联关系;
[0011]基于所述图谱数据模式和所述辅助信息,将所述辅助信息存储至所述目标图数据库中。
[0012]第二方面,提供一种隐私数据处理装置,包括:
[0013]第一获取单元,获取对源数据库执行的涉及隐私数据的结构化查询SQL语句和与所述隐私数据相关的辅助信息,所述辅助信息用于描述所述隐私数据所在的字段及数据表的属性;
[0014]解析单元,对获取的SQL语句进行语义解析,以得到所述源数据库中的隐私数据之间的血缘关系信息,所述血缘关系信息用于指示所述隐私数据所在的字段之间的关联关
系、所述隐私数据所在的数据表之间的关联关系以及所述字段和所述数据表之间的关联关系;
[0015]创建单元,基于所述血缘关系信息,在目标图数据库中创建表征所述隐私数据之间的血缘关系的图谱数据模式,所述图谱数据模式包括多个节点和连接不同节点的边,所述节点表示字段或数据表,所述边表示相连接的节点之间的关联关系;
[0016]存储单元,基于所述图谱数据模式和所述辅助信息,将所述辅助信息存储至所述目标图数据库中。
[0017]第三方面,提供一种电子设备,包括:
[0018]处理器;以及
[0019]被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
[0020]获取对源数据库执行的涉及隐私数据的结构化查询SQL语句和与所述隐私数据相关的辅助信息,所述辅助信息用于描述所述隐私数据所在的字段及数据表的属性;
[0021]对获取的SQL语句进行语义解析,以得到所述源数据库中的隐私数据之间的血缘关系信息,所述血缘关系信息用于指示所述隐私数据所在的字段之间的关联关系、所述隐私数据所在的数据表之间的关联关系以及所述字段和所述数据表之间的关联关系;
[0022]基于所述血缘关系信息,在目标图数据库中创建表征所述隐私数据之间的血缘关系的图谱数据模式,所述图谱数据模式包括多个节点和连接不同节点的边,所述节点表示字段或数据表,所述边表示相连接的节点之间的关联关系;
[0023]基于所述图谱数据模式和所述辅助信息,将所述辅助信息存储至所述目标图数据库中。
[0024]第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
[0025]获取对源数据库执行的涉及隐私数据的结构化查询SQL语句和与所述隐私数据相关的辅助信息,所述辅助信息用于描述所述隐私数据所在的字段及数据表的属性;
[0026]对获取的SQL语句进行语义解析,以得到所述源数据库中的隐私数据之间的血缘关系信息,所述血缘关系信息用于指示所述隐私数据所在的字段之间的关联关系、所述隐私数据所在的数据表之间的关联关系以及所述字段和所述数据表之间的关联关系;
[0027]基于所述血缘关系信息,在目标图数据库中创建表征所述隐私数据之间的血缘关系的图谱数据模式,所述图谱数据模式包括多个节点和连接不同节点的边,所述节点表示字段或数据表,所述边表示相连接的节点之间的关联关系;
[0028]基于所述图谱数据模式和所述辅助信息,将所述辅助信息存储至所述目标图数据库中。
[0029]本说明书实施例的方案,通过对源数据库执行的、涉及隐私数据的SQL语句进行语义解析,来获得包含隐私数据所在的字段之间的关联关系、隐私数据所在的数据表之间的关联关系以及隐私数据所在的字段与数据表之间的关联关系在内的源数据库中隐私数据之间的血缘关系信息,所得到的血缘关系信息能够更精细地反映隐私数据之间的血缘关系;基于血缘关系信息在目标图数据库中创建表征隐私数据之间的血缘关系的图谱数据模
式(Schema),而图谱数据模式中的节点表征字段或数据表,图谱数据模式中的边表征相连接的节点之间的关联关系,进一步基于图谱数据模式将辅助信息存储至目标图数据库中,使得隐私数据之间的血缘关系能够以知识图谱的形式进行存储,实现将对隐私数据的管理由“点”推向“面”,进而能够更方便快捷地利用隐私数据之间的血缘关系对隐私数据实施纠错、溯源、合规性判定等,提高对隐私数据管理的效率和便捷性。
附图说明
[0030]此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
[0031]图1为本说明书的一个实施例的隐私数据处理方法的整体方案流程示意图;
[0032]图2为本说明书的另一个实施例的隐私数据处理方法的整体方案流程示意图;
[0033]图3为本说明书的又一个实施例的隐私数据处理方法的整体方案流程示意图;
[0034]图4为本说明书的一个实施例提供的一种隐私数据处理方法的流程示意图;
[0035]图5为本说明书的一个实施例提供的一种图谱数据模式的示意图;
[0036]图6为本说明书的另一个实施例提供的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种隐私数据处理方法,包括:获取对源数据库执行的涉及隐私数据的结构化查询SQL语句和与所述隐私数据相关的辅助信息,所述辅助信息用于描述所述隐私数据所在的字段及数据表的属性;对获取的SQL语句进行语义解析,以得到所述源数据库中的隐私数据之间的血缘关系信息,所述血缘关系信息用于指示所述隐私数据所在的字段之间的关联关系、所述隐私数据所在的数据表之间的关联关系以及所述字段和所述数据表之间的关联关系;基于所述血缘关系信息,在目标图数据库中创建表征所述隐私数据之间的血缘关系的图谱数据模式,所述图谱数据模式包括多个节点和连接不同节点的边,所述节点表示字段或数据表,所述边表示相连接的节点之间的关联关系;基于所述图谱数据模式,将所述辅助信息存储至所述目标图数据库中。2.如权利要求1所述的方法,在基于所述血缘关系信息,在目标图数据库中创建表征所述隐私数据之间的血缘关系的图谱数据模式之前,所述方法还包括:查询所述源数据库中是否存储有所述隐私数据之间的存量关联关系信息;所述基于所述血缘关系信息,在目标图数据库中创建表征所述隐私数据之间的血缘关系的图谱数据模式,包括:如果所述源数据库中存储有所述存量关联关系信息,则将所述血缘关系信息和所述存量关联关系信息进行融合;基于融合后的血缘关系信息,在所述目标图数据库中创建所述图谱数据模式。3.如权利要求2所述的方法,在基于融合后的血缘关系信息,在所述目标图数据库中创建所述图谱数据模式之前,还包括:基于所述融合后的血缘关系信息,获取第一隐私字段和第二隐私字段各自的元数据,所述第一隐私字段和所述第二隐私字段分别为所述隐私数据所在的、关联关系为复制关系的不同字段;将所述第一隐私字段的元数据和所述第二隐私字段的元数据进行比对,得到差异度;如果所述差异度超过差异度阈值,则删除所述融合后的血缘关系信息中所述第一隐私字段和所述第二隐私字段之间的关联关系信息。4.如权利要求1所述的方法,在基于所述图谱数据模式,将所述辅助信息存储至所述目标图数据库中之后,所述方法还包括:按照预设时间间隔,获取对所述源数据库执行的涉及隐私数据的增量操作信息;基于所述增量操作信息和与所述隐私数据相关的辅助信息,确定所述隐私数据之间的增量血缘关系信息;获取所述增量血缘关系信息与所述源数据库中存储的存量关联关系信息之间的差异信息;基于所述差异信息,更新所述存量关联关系信息和所述目标图数据库。5.如权利要求4所述的方法,所述存量关联关系信息存储于所述源数据库的存量关联关系表中;所述获取所述增量血缘关系信息与所述源数据库中存储的存量关联关系信息之间的差异信息,包括:基于所述增量血缘关系信息,生成增量血缘关系表;
基于所述增量血缘关系表与所述存量关联关系表之间的差集,确定所述增量血缘关系信息与所述存量关联关系信息之间的差异信息。6.如权利要求1所述的方法,所述基于所述血缘关系信息,在目标图数据库中创建表征所述隐私数据之间的血缘关系的图谱数据模式,包括:将所述隐私数据之间的血缘关系信息转化为三元组结构数据;基于所述三元组结构数据指示的源节点和目标节点,生成图谱数据模...

【专利技术属性】
技术研发人员:刘佳伟鲍梦瑶章鹏张谦殷雪梅刘新源
申请(专利权)人:蚂蚁区块链科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1