隐私数据的数据存储架构构建方法、装置、设备及介质制造方法及图纸

技术编号:41183139 阅读:25 留言:0更新日期:2024-05-07 22:16
本申请公开了一种隐私数据的数据存储架构构建方法、装置、设备及介质,涉及隐私计算技术领域,包括:分别计算关系数据库中各目标数据与目标类敏感数据之间的相似度,并在相似度满足预设阈值条件时将目标数据确定为隐私数据;对隐私数据进行隐私级别判定,并利用与判定结果对应的脱敏方法对隐私数据进行脱敏处理得到处理后数据;按照树形目录结构将处理后数据存储至与判定结果对应的目标数据表,基于数据同步工具和预设数据导入引擎将目标数据表导入至目标数据存储架构。本申请根据隐私级别针对性的对数据进行脱敏并采用不同的数据表存储对应的脱敏数据,再进一步充入到目标数据存储架构,形成外部可直接使用的隐私数据存储架构。

【技术实现步骤摘要】

本专利技术涉及隐私计算,特别涉及一种隐私数据的数据存储架构构建方法、装置、设备及介质


技术介绍

1、数据化时代代表着更多数据的产生,也代表着更多不同类型的数据的产生,数据间联通起来会为智能社会提供更多可供训练的大模型数据。而数据流通过程中可能会产生涉及个人、集体敏感信息的泄漏问题,因此而数据要想真正成为既可以自由流通,又能具备安全性的战略资源,就绕不开隐私数据这一环节。隐私计算可以让数据在流通过程实现“可用不可见”,在保护数据隐私的前提下,解决数据流通、应用等数据服务问题,成为解决数据利用和安全性这对矛盾的重要途径。

2、相关技术方案是将需要分析的数据都集中到数据仓库中,而大模型的兴起对数据的需求更加灵活,如果从数据仓库中提取会有一些问题。目前在数据仓库的方案中底层应用较多为hdfs(hadoopdistributedfilesystem,hadoop下的分布式文件系统,hadoop是一个开源软件框架)体系,但多个仓库之间是隔离不通的,数据不能共享互通且不注重隐私保护。而在数据化的社会应用中,信息之间不是独立的,需要能有共同转化的地方,也需要本文档来自技高网...

【技术保护点】

1.一种隐私数据的数据存储架构构建方法,其特征在于,包括:

2.根据权利要求1所述的隐私数据的数据存储架构构建方法,其特征在于,所述分别计算关系数据库中各目标数据与目标类敏感数据之间的相似度以得到目标相似度值,包括:

3.根据权利要求2所述的隐私数据的数据存储架构构建方法,其特征在于,所述相似度计算表达式为:

4.根据权利要求1所述的隐私数据的数据存储架构构建方法,其特征在于,所述目标数据为结构化数据;

5.根据权利要求1所述的隐私数据的数据存储架构构建方法,其特征在于,所述目标数据为包括半结构化数据或非结构化数据;p>

6.根据权...

【技术特征摘要】

1.一种隐私数据的数据存储架构构建方法,其特征在于,包括:

2.根据权利要求1所述的隐私数据的数据存储架构构建方法,其特征在于,所述分别计算关系数据库中各目标数据与目标类敏感数据之间的相似度以得到目标相似度值,包括:

3.根据权利要求2所述的隐私数据的数据存储架构构建方法,其特征在于,所述相似度计算表达式为:

4.根据权利要求1所述的隐私数据的数据存储架构构建方法,其特征在于,所述目标数据为结构化数据;

5.根据权利要求1所述的隐私数据的数据存储架构构建方法,其特征在于,所述目标数据为包括半结构化数据或非结构化数据;

6.根据权利要求1所述的隐私数据的数据存储架构构建方法,其特征在于,所述目标类敏感数据为预设敏感数据范围内的至少一类敏感数据,所述预设敏感数据范围包括预先经过敏感数据类别划分后得到的多类敏感数据。

7.根据权利要求6所述的隐私数据的数据存储架构构建方法,其特征在于,所述对所述隐私数据进行隐私级别判定以得到判定结果,包括:

8.根据权利要求...

【专利技术属性】
技术研发人员:冯晓庆
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1