当前位置: 首页 > 专利查询>周大飞专利>正文

大数据匿名迁移处理方法及匿名迁移处理服务器技术

技术编号:37810407 阅读:6 留言:0更新日期:2023-06-09 09:40
本发明专利技术提供一种大数据匿名迁移处理方法及匿名迁移处理服务器,在优化数据匿名迁移算法时,不仅迁移标的脱敏业务数据与待匿名敏感业务数据自身的匿名迁移要素向量会用于数据翻译从而得到已匿名业务数据,迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量,也会用于数据翻译从而得到已匿名业务数据,使得所确定的已匿名业务数据不仅可以基于迁移标的脱敏业务数据的原始泛化信息进行选择性匿名处理,还可以基于待匿名敏感业务数据的敏感信息进行精准化匿名,换言之,在参考了迁移标的脱敏业务数据的整体的数据匿名逻辑的情况下,还可以自适应地基于待匿名敏感业务数据的敏感信息进行匿名处理微调。匿名处理微调。匿名处理微调。

【技术实现步骤摘要】
大数据匿名迁移处理方法及匿名迁移处理服务器


[0001]本专利技术涉及大数据匿名
,尤其涉及一种大数据匿名迁移处理方法及匿名迁移处理服务器。

技术介绍

[0002]相比直接删除敏感/隐私数据,数据匿名化处理可以保留相关信息供其他功能应用,也即可以让数据的非敏感部分仍然能得到较为广泛的利用。进一步地,数据匿名化还可以避免数据滥用和隐私数据泄露,增强信息安全性。此外,数据匿名化可以强化数据管理和一致性,在保证准确的数据能够支持应用程序和服务的同时,还能够保护大数据分析和隐私。因此,数据匿名处理在数字业务和云业务大环境下扮演了重要的角色。当下,随着数据规模和数据类型的激增,传统的数据匿名技术存在效率低下的问题,为改善该问题,一些技术尝试利用已匿名数据作为模板来进行其他数据的匿名处理(也可以称为数据匿名迁移),但是这类技术在实施过程中,匿名迁移处理的精度和可信度难以得到保障。

技术实现思路

[0003]本专利技术提供一种大数据匿名迁移处理方法及匿名迁移处理服务器,为实现上述技术目的,本专利技术采用如下技术方案。
[0004]第一方面是一种大数据匿名迁移处理方法,应用于匿名迁移处理服务器,所述方法包括:
[0005]获得匿名迁移数据集,所述匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据;
[0006]依据所述迁移标的脱敏业务数据的原始泛化信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量;
[0007]调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,并依据整理所述匿名迁移要素向量与所述匿名跳转联动向量所得的数据匿名输出向量进行数据翻译,得到已匿名业务数据;
[0008]调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,所述数据类别包括敏感类别和泛化类别;
[0009]利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层。
[0010]在一些可独立的实施例中,所述获得匿名迁移数据集,包括:
[0011]获得第一在线业务交互数据与第二在线业务交互数据,所述第一在线业务交互数
据与第二在线业务交互数据对应相同的敏感要素主题,且对应不同的原始泛化要素主题;
[0012]获得第三在线业务交互数据,所述第三在线业务交互数据与所述第一在线业务交互数据对应不同的敏感要素主题;
[0013]基于针对所述第二在线业务交互数据和所述第三在线业务交互数据的敏感数据匿名迁移,得到第四在线业务交互数据;
[0014]将所述第一在线业务交互数据作为待匿名敏感业务数据、所述第四在线业务交互数据作为迁移标的脱敏业务数据、所述第二在线业务交互数据作为匿名迁移辅助决策数据,以获得一个匿名迁移数据集。
[0015]在一些可独立的实施例中,所述方法还包括:
[0016]调用所述数据匿名迁移算法的泛化知识抽取层,对所述迁移标的脱敏业务数据进行知识抽取,得到所述迁移标的脱敏业务数据的原始泛化信息描述向量;
[0017]调用所述数据匿名迁移算法的敏感知识抽取层,对所述待匿名敏感业务数据进行知识抽取,得到所述待匿名敏感业务数据的敏感信息描述向量;
[0018]其中,所述泛化知识抽取层与所述敏感知识抽取层,皆是事先完成优化的人工智能算法。
[0019]在一些可独立的实施例中,所述调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,包括:
[0020]将所述待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,得到混合业务数据;
[0021]将所述混合业务数据加载到所述数据匿名迁移算法;调用所述数据匿名迁移算法的匿名迁移处理层,对所述混合业务数据进行数据挖掘,得到对所述迁移标的脱敏业务数据进行匿名迁移所对应的匿名迁移要素向量。
[0022]在一些可独立的实施例中,所述方法还包括:
[0023]分别确定所述匿名迁移要素向量、所述匿名跳转联动向量的第一量化指标与第二量化指标;
[0024]结合所述匿名迁移要素向量的第一量化指标与第二量化指标,对所述匿名迁移要素向量进行标准化处理,得到标准化后的匿名迁移要素向量;
[0025]结合所述匿名跳转联动向量的第一量化指标与第二量化指标,将所述匿名跳转联动向量的匿名推演特征映射到所述标准化后的匿名迁移要素向量,得到所述数据匿名输出向量。
[0026]在一些可独立的实施例中,所述调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,包括:
[0027]将所述已匿名业务数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述已匿名业务数据属于泛化类别的第一可能性;
[0028]将所述匿名迁移辅助决策数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述匿名迁移辅助决策数据属于泛化类别的第二可能性。
[0029]在一些可独立的实施例中,在得到已匿名业务数据之后,所述方法还包括:
[0030]调用所述数据匿名迁移算法的泛化知识抽取层,对所述已匿名业务数据进行知识抽取,得到所述已匿名业务数据的原始泛化信息描述向量;
[0031]调用所述数据匿名迁移算法的敏感知识抽取层,对所述已匿名业务数据进行知识抽取,得到所述已匿名业务数据的敏感信息描述向量;
[0032]其中,所述泛化知识抽取层与所述敏感知识抽取层,皆是事先完成优化的人工智能算法。
[0033]在一些可独立的实施例中,所述利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层,包括:
[0034]在锁定所述匿名迁移处理层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性与所述匿名迁移辅助决策数据属于泛化类别的第二可能性,生成针对所述匿名迁移评估层的评估代价,利用所述评估代价改进所述匿名迁移评估层的算法变量;
[0035]在锁定所述匿名迁移评估层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移处理层的匿名迁移代价,结合所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大数据匿名迁移处理方法,其特征在于,应用于匿名迁移处理服务器,所述方法包括:获得匿名迁移数据集,所述匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据;依据所述迁移标的脱敏业务数据的原始泛化信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量;调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,并依据整理所述匿名迁移要素向量与所述匿名跳转联动向量所得的数据匿名输出向量进行数据翻译,得到已匿名业务数据;调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,所述数据类别包括敏感类别和泛化类别;利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层。2.根据权利要求1所述的方法,其特征在于,所述获得匿名迁移数据集,包括:获得第一在线业务交互数据与第二在线业务交互数据,所述第一在线业务交互数据与第二在线业务交互数据对应相同的敏感要素主题,且对应不同的原始泛化要素主题;获得第三在线业务交互数据,所述第三在线业务交互数据与所述第一在线业务交互数据对应不同的敏感要素主题;基于针对所述第二在线业务交互数据和所述第三在线业务交互数据的敏感数据匿名迁移,得到第四在线业务交互数据;将所述第一在线业务交互数据作为待匿名敏感业务数据、所述第四在线业务交互数据作为迁移标的脱敏业务数据、所述第二在线业务交互数据作为匿名迁移辅助决策数据,以获得一个匿名迁移数据集。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:调用所述数据匿名迁移算法的泛化知识抽取层,对所述迁移标的脱敏业务数据进行知识抽取,得到所述迁移标的脱敏业务数据的原始泛化信息描述向量;调用所述数据匿名迁移算法的敏感知识抽取层,对所述待匿名敏感业务数据进行知识抽取,得到所述待匿名敏感业务数据的敏感信息描述向量;其中,所述泛化知识抽取层与所述敏感知识抽取层,皆是事先完成优化的人工智能算法。4.根据权利要求1所述的方法,其特征在于,所述调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,包括:将所述待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,得到混合业务数据;将所述混合业务数据加载到所述数据匿名迁移算法;调用所述数据匿名迁移算法的匿名迁移处理层,对所述混合业务数据进行数据挖掘,
得到对所述迁移标的脱敏业务数据进行匿名迁移所对应的匿名迁移要素向量;其中,所述调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,包括:将所述已匿名业务数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述已匿名业务数据属于泛化类别的第一可能性;将所述匿名迁移辅助决策数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述匿名迁移辅助决策数据属于泛化类别的第二可能性;其中,所述利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层,包括:在锁定所述匿名迁移处理层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性与所述匿名迁移辅助决策数据属于泛化类别的第二可能性,生成针对所述匿名迁移评估层的评估代价,利用所述评估代价改进所述匿名迁移评估层的算法变量;在锁定所述匿名迁移评估层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移...

【专利技术属性】
技术研发人员:周大飞艾晓波
申请(专利权)人:周大飞
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1