隐私计算、隐私数据和联邦学习的数据管理方法技术

技术编号:36082407 阅读:9 留言:0更新日期:2022-12-24 10:56
本申请涉及隐私计算、隐私数据和联邦学习技术领域,具体涉及一种隐私计算、隐私数据和联邦学习的数据管理方法。方法包括:在第一界面上提供第一组件从而使得数据源方可以通过第一组件录入数据集相关联的信息;将数据集输入机器学习模型,机器学习模型用于对数据集进行处理从而根据一级行业分类库和在该一级行业分类库下设的二级特征分类库生成数据集相关联的数据测绘结果;通过比较数据应用方的检索偏好和数据测绘结果来判断是否显示数据集,如果是,则在第二界面上展示数据集相关联的信息并提供第二组件从而使得数据应用方可以通过第二组件选择所述数据集。如此有利于提高识别匹配效率。别匹配效率。别匹配效率。

【技术实现步骤摘要】
隐私计算、隐私数据和联邦学习的数据管理方法


[0001]本申请涉及隐私计算、隐私数据和联邦学习
,具体涉及一种隐私计算、隐私数据和联邦学习的数据管理方法。

技术介绍

[0002]参与生产经营活动并发挥重要价值的数据被称之为要素数据。而以电子化的方式记录要素数据或者说将要素数据转化为可以由计算机理解的形式,则称之为数据要素。要素数据以及在此基础上获得的数据要素,可用于数据赋能并在诸如智能设备、智能医疗、智能交通和智能商务等各方面提高生产率和促进创新。因此存在持续发展的市场需求,希望在保证数据隐私和安全的前提下,释放和挖掘数据要素价值,搭建高效可靠的数据共享流通平台和机制,以及构建数据交易联盟。为了满足挖掘数据要素价值和促进数据要素交易流通的需求,通过数据交易市场、数据交易所、数据交易联盟或者其它组织形式,发挥数据价值和将数据作为可交易的资产实现潜在商业价值的合理配置。但是,现有技术中,在关于数据要素的数据申请及授权环节,存在多个需要解决的技术难题,例如缺少按类别维度进行自动化分级分类、缺少对部分特征及全部特征的差异化申请及授权方式、缺少按时间维度定制化申请及授权数据、缺少对数据使用次数及频率的控制、缺少对数据可见性的区分。
[0003]为此,需要一种隐私计算、隐私数据和联邦学习的数据管理方法,能够解决上述关于数据要素的数据申请及授权环节的技术难题以及满足释放和挖掘数据要素价值、搭建高效可靠的数据共享流通平台和机制以及构建数据交易联盟的需求。

技术实现思路

[0004]第一方面,本申请实施例提供了一种数据管理方法。所述数据管理方法包括:在呈现给数据源方的第一界面上提供第一组件从而使得所述数据源方可以通过所述第一组件录入数据集相关联的信息;将所述数据集输入机器学习模型,所述机器学习模型用于对所述数据集进行处理从而根据一级行业分类库和在该一级行业分类库下设的二级特征分类库生成所述数据集相关联的数据测绘结果;通过比较数据应用方的检索偏好和所述数据测绘结果来判断是否显示所述数据集,如果是,则在呈现给数据应用方的第二界面上展示所述数据集相关联的信息并提供第二组件从而使得所述数据应用方可以通过所述第二组件选择所述数据集。其中,当所述数据应用方选择所述数据集时,所述数据集相关联的信息、所述检索偏好以及所述数据测绘结果用于优化所述机器学习模型。
[0005]第一方面所描述的技术方案,实现了数据源方所发布的数据集的特性与数据应用方的检索偏好之间的匹配,在数据要素的数据申请及授权环节上通过机器学习模型对数据集进行处理从而根据一级行业分类库和在该一级行业分类库下设的二级特征分类库生成数据集相关联的数据测绘结果,有利于提高识别匹配效率。
[0006]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述数据测绘结果包括所述数据集的数据资产分级分类结果。
[0007]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述数据集的数据资产分级分类结果用于按照类别维度对所述数据集的数据特征进行自动化分级分类。
[0008]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述数据源方还可以通过所述第一组件选择所述数据集对指定数据应用方为可见或者不可见,所述数据管理方法还包括:基于所述数据源方所选择的所述数据集对所述指定数据应用方为可见或者不可见,判断是否显示所述数据集。
[0009]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述一级行业分类库用于按照行业数据特性区分所述数据集的数据特征。
[0010]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述二级特征分类库用于按照关键字段匹配规则识别所述数据集的数据特征中的关键字段。
[0011]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述关键字段匹配规则包括模糊匹配规则和精确匹配规则,所述机器学习模型还用于确定所述数据集的数据特征中的关键字段的扫描时间相对于命中率的优先级,所述二级特征分类库用于按照所述模糊匹配规则识别所述数据集的数据特征中的扫描时间相对于命中率的优先级较低的关键字段以及用于按照所述精确匹配规则识别所述数据集的数据特征中的扫描时间相对于命中率的优先级较高的关键字段。
[0012]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述机器学习模型还用于,对所识别的所述数据集的数据特征中的关键字段进行正则化处理。
[0013]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述检索偏好包括至少一个标签,当所述数据测绘结果符合所述至少一个标签中的一个或者多个标签时显示所述数据集。
[0014]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述检索偏好还包括至少一个时间要求,当所述数据测绘结果符合所述至少一个时间要求时显示所述数据集,所述至少一个时间要求包括回溯时间范围、使用时间范围或者销毁时间范围。
[0015]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,生成所述数据测绘结果包括按照多个特征标签标注所述数据集的数据特征,所述检索偏好包括所述多个特征标签中的一个或者多个特征标签,当所述数据测绘结果符合所述一个或者多个特征标签时显示所述数据集。
[0016]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述检索偏好还包括使用次数要求,当所述数据集的使用次数符合所述使用次数要求时显示所述数据集。
[0017]根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述数据管理方法还包括:当所述数据应用方的进行中的任务数量达到第一阈值或者进行中的所述数据集相关联的任务数量达到第二阈值时,禁止所述数据应用方发起所述数据集相关联的新任务。
[0018]第二方面,本申请实施例提供了一种非瞬时性计算机可读存储介质。所述计算机可读存储介质存储有计算机指令,该计算机指令被处理器执行时实现根据第一方面中任一
项所述的方法。
[0019]第二方面所描述的技术方案,实现了数据源方所发布的数据集的特性与数据应用方的检索偏好之间的匹配,在数据要素的数据申请及授权环节上通过机器学习模型对数据集进行处理从而根据一级行业分类库和在该一级行业分类库下设的二级特征分类库生成数据集相关联的数据测绘结果,有利于提高识别匹配效率。
[0020]第三方面,本申请实施例提供了一种电子设备。所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器通过运行所述可执行指令以实现根据第一方面中任一项所述的方法。
[0021]第三方面所描述的技术方案,实现了数据源方所发布的数据集的特性与数据应用方的检索偏好之间的匹配,在数据要素的数据申请及授权环节上通过机器学习模型对数据集进行处理从而根据一级行业分类库和在该一级行业分类库下设的二级特征分类库生成数据集相关联的数据测绘结果,有利本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于隐私计算、隐私数据和联邦学习的数据管理方法,其特征在于,所述数据管理方法包括:在呈现给数据源方的第一界面上提供第一组件从而使得所述数据源方可以通过所述第一组件录入数据集相关联的信息;将所述数据集输入机器学习模型,所述机器学习模型用于对所述数据集进行处理从而根据一级行业分类库和在该一级行业分类库下设的二级特征分类库生成所述数据集相关联的数据测绘结果;通过比较数据应用方的检索偏好和所述数据测绘结果来判断是否显示所述数据集,如果是,则在呈现给数据应用方的第二界面上展示所述数据集相关联的信息并提供第二组件从而使得所述数据应用方可以通过所述第二组件选择所述数据集,其中,当所述数据应用方选择所述数据集时,所述数据集相关联的信息、所述检索偏好以及所述数据测绘结果用于优化所述机器学习模型。2.根据权利要求1所述的数据管理方法,其特征在于,所述数据测绘结果包括所述数据集的数据资产分级分类结果。3.根据权利要求2所述的数据管理方法,其特征在于,所述数据集的数据资产分级分类结果用于按照类别维度对所述数据集的数据特征进行自动化分级分类。4.根据权利要求1所述的数据管理方法,其特征在于,所述数据源方还可以通过所述第一组件选择所述数据集对指定数据应用方为可见或者不可见,所述数据管理方法还包括:基于所述数据源方所选择的所述数据集对所述指定数据应用方为可见或者不可见,判断是否显示所述数据集。5.根据权利要求1所述的数据管理方法,其特征在于,所述一级行业分类库用于按照行业数据特性区分所述数据集的数据特征。6.根据权利要求5所述的数据管理方法,其特征在于,所述二级特征分类库用于按照关键字段匹配规则识别所述数据集的数据特征中的关键字段。7.根据权利要求6所述的数据管理方法,其特征在于,所述关键字段匹配规则包括模糊匹配规则和精确匹配规则,所述机器学习模型还用于确定所述数据集的数据特征中的关键字段的扫描时间相对于命中率的优先级,所述二级特征分类库用于按照所述模糊匹配...

【专利技术属性】
技术研发人员:王雨竹赵彬
申请(专利权)人:深圳致星科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1