一种在数据管理系统中对数据访问进行管理的方法技术方案

技术编号:38475561 阅读:28 留言:0更新日期:2023-08-15 16:55
本发明专利技术提供了一种在数据管理系统中对数据访问进行管理的方法,所述系统包括数据使用者执行环境,所述环境是基于受监管的方式授权用户使用数据所有者的数据进行数据分析的数据分析环境,所述方法包括:在数据使用者执行环境中,确定用户定义的数据分析流程文件中用户自定义的变量,为变量生成对应的指纹集合,其中,该指纹集合指示对应变量所关联的所述数据所有者的数据;响应于用户申请导出相应自定义的变量的值的请求,根据用于保护数据安全的预设的变量导出规则表和该变量对应的指纹集合,确定申请导出的变量的值能否导出所述数据使用者执行环境;由此,以限定用户自定义的变量的导出行为,保护数据所有者的数据财产安全。全。全。

【技术实现步骤摘要】
一种在数据管理系统中对数据访问进行管理的方法


[0001]本专利技术涉及大数据领域,具体来说涉及大数据的访问控制,更具体地说,涉及一种在数据管理系统中对数据访问进行管理的方法。

技术介绍

[0002]随着大数据价值日益凸显。人们对数据保护的意识越来越高。在一些场景下,一些人或者单位会花费大量的时间、精力、金钱去收集一些数据,所收集的数据可以被用于开发、训练或者微调预测模型,以实现一些场景下的预测任务。
[0003]但是,所收集的数据作为一种无形的财产,若不受控制地提供给任意一个用户,该用户可以随意复制、拷贝数据,将导致数据所有者的数据安全(也称为数据财产安全)受到影响。因此,数据所有者一般会为数据使用者提供一个数据分析环境。该数据分析环境的主要目的是防止数据扩散。在实践中该数据分析环境可能是一台不提供外部数据存储的主机,例如:不配置软盘、U盘等;或是一个不支持数据存储功能的软件系统。
[0004]目前现有的防止数据扩散的数据分析环境不仅拒绝用户导出数据,还拒绝用户导出基于数据进行运算得到的衍生信息(比如训练出的预测模型的参数和计本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种在数据管理系统中对数据访问进行管理的方法,所述数据管理系统包括数据使用者执行环境,所述数据使用者执行环境是基于受监管的方式授权用户使用数据所有者的数据进行数据分析的数据分析环境,所述方法包括:在所述数据使用者执行环境中,确定用户定义的数据分析流程文件中用户自定义的变量,为所述变量生成对应的指纹集合,其中,该指纹集合指示对应变量所关联的所述数据所有者的数据;响应于用户申请导出相应自定义的变量的值的请求,根据用于保护数据安全的预设的变量导出规则表和该变量对应的指纹集合,确定申请导出的变量的值能否导出所述数据使用者执行环境,其中,所述变量导出规则表中记录有用户历史定义的一个或者多个变量、各变量对应的指纹集合以及各变量的可导出标志的历史数据。2.根据权利要求1所述的方法,其中,所述确定申请导出的变量的值能否导出所述数据使用者执行环境按照以下方式确定:根据用户当前申请导出的变量对应的指纹集合与历史数据中记录的已经导出的变量对应的指纹集合,确定当前申请导出的变量能否导出,其中,用户当前申请导出的变量,为用户当前申请导出的变量的值对应的变量。3.根据权利要求2所述的方法,其中,如果依据当前申请导出的变量的值或者依据当前申请导出的变量的值与已经导出的变量的值的组合能反推出相关指纹集合所指示的数据,确定所述当前申请导出的变量的值不能导出。4.根据权利要求2所述的方法,其中,在当前申请导出的变量存在以下任意一种情况下时其不能导出:当前申请导出的变量对应的指纹集合只含有一个元素;当前申请导出的变量对应的指纹集合是历史数据中记录的已经导出的单个变量对应的指纹集合的最小父集合或者最大子集合;当前申请导出的变量对应的指纹集合与历史数据记录的已经导出的两个或者两个以上变量对应的指纹集合通过并操作的方式能组合形成最小父集合或者最大子集合。5.根据权利要求1所述的方法,其中,确定用户定义的数据分析流程文件中用户自定义的变量时,对用户自定义的每个变量分配标识该变量身份的唯一的变量内码,以及针对每个变量内码维护其对应的指纹集合,其中,不同指纹集合中,针对同一数据设有标识该数据身份的描述方式。6.根据权利要求1所述的方法,其中,所述数据管理系统还包括数据所有者或者数据所有者授权的业务管理者,所述方法还包括:将基于预设的哈希运算确定的变量导出规则表的摘要同步给数据所有者或者数据所有者授权的业务管理者,以用于通过检验摘要的连续性阻止异常用户使用数据。7.根据权利要求1所述的方法,其中,所述可导出标志包括:待定、可导出和不可导出。8.根据权利要求1

7任一项所述的方法,其中,任一变量的指纹集合不为空集的情况下,表示该变量的值是基于该变量对应指纹集合中的数据计算所得到。9.根据权利要求8所述的方法,其特征在于,所述用户定义的数据分析流程文件用于在所述数据使用者执行环境中进行模型的训练和/或预测,所述数据分析流程文件中以变量方式存储模型的参数值、基于模型的部分参数得到的中间值和模型的输出值。
10.一种数据管理系统,其特征在于,包...

【专利技术属性】
技术研发人员:傅川
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1