【技术实现步骤摘要】
大数据匿名迁移处理方法及匿名迁移处理服务器
[0001]本专利技术涉及大数据匿名
,尤其涉及一种大数据匿名迁移处理方法及匿名迁移处理服务器。
技术介绍
[0002]相比直接删除敏感/隐私数据,数据匿名化处理可以保留相关信息供其他功能应用,也即可以让数据的非敏感部分仍然能得到较为广泛的利用。进一步地,数据匿名化还可以避免数据滥用和隐私数据泄露,增强信息安全性。此外,数据匿名化可以强化数据管理和一致性,在保证准确的数据能够支持应用程序和服务的同时,还能够保护大数据分析和隐私。因此,数据匿名处理在数字业务和云业务大环境下扮演了重要的角色。当下,随着数据规模和数据类型的激增,传统的数据匿名技术存在效率低下的问题,为改善该问题,一些技术尝试利用已匿名数据作为模板来进行其他数据的匿名处理(也可以称为数据匿名迁移),但是这类技术在实施过程中,匿名迁移处理的精度和可信度难以得到保障。
技术实现思路
[0003]本专利技术提供一种大数据匿名迁移处理方法及匿名迁移处理服务器,为实现上述技术目的,本专利技术采用如下技术方案。
[0004]第一方面是一种大数据匿名迁移处理方法,应用于匿名迁移处理服务器,所述方法包括:
[0005]获得匿名迁移数据集,所述匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据;
[0006]依据所述迁移标的脱敏业务数据的原始泛化信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量;
[0007]调用所述数据 ...
【技术保护点】
【技术特征摘要】
1.一种大数据匿名迁移处理方法,其特征在于,应用于匿名迁移处理服务器,所述方法包括:获得匿名迁移数据集,所述匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据;依据所述迁移标的脱敏业务数据的原始泛化信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量;调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,并依据整理所述匿名迁移要素向量与所述匿名跳转联动向量所得的数据匿名输出向量进行数据翻译,得到已匿名业务数据;调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,所述数据类别包括敏感类别和泛化类别;利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层。2.根据权利要求1所述的方法,其特征在于,所述获得匿名迁移数据集,包括:获得第一在线业务交互数据与第二在线业务交互数据,所述第一在线业务交互数据与第二在线业务交互数据对应相同的敏感要素主题,且对应不同的原始泛化要素主题;获得第三在线业务交互数据,所述第三在线业务交互数据与所述第一在线业务交互数据对应不同的敏感要素主题;基于针对所述第二在线业务交互数据和所述第三在线业务交互数据的敏感数据匿名迁移,得到第四在线业务交互数据;将所述第一在线业务交互数据作为待匿名敏感业务数据、所述第四在线业务交互数据作为迁移标的脱敏业务数据、所述第二在线业务交互数据作为匿名迁移辅助决策数据,以获得一个匿名迁移数据集。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:调用所述数据匿名迁移算法的泛化知识抽取层,对所述迁移标的脱敏业务数据进行知识抽取,得到所述迁移标的脱敏业务数据的原始泛化信息描述向量;调用所述数据匿名迁移算法的敏感知识抽取层,对所述待匿名敏感业务数据进行知识抽取,得到所述待匿名敏感业务数据的敏感信息描述向量;其中,所述泛化知识抽取层与所述敏感知识抽取层,皆是事先完成优化的人工智能算法。4.根据权利要求1所述的方法,其特征在于,所述调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,包括:将所述待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,得到混合业务数据;将所述混合业务数据加载到所述数据匿名迁移算法;调用所述数据匿名迁移算法的匿名迁移处理层,对所述混合业务数据进行数据挖掘,
得到对所述迁移标的脱敏业务数据进行匿名迁移所对应的匿名迁移要素向量;其中,所述调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,包括:将所述已匿名业务数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述已匿名业务数据属于泛化类别的第一可能性;将所述匿名迁移辅助决策数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述匿名迁移辅助决策数据属于泛化类别的第二可能性;其中,所述利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层,包括:在锁定所述匿名迁移处理层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性与所述匿名迁移辅助决策数据属于泛化类别的第二可能性,生成针对所述匿名迁移评估层的评估代价,利用所述评估代价改进所述匿名迁移评估层的算法变量;在锁定所述匿名迁移评估层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。