数据脱敏处理方法和装置制造方法及图纸

技术编号：14371758 阅读：75 留言：0更新日期：2017-01-09 17:39

本申请提出一种数据脱敏处理方法和装置，该数据脱敏处理方法包括获取待处理的原始数据；采用预设的算法，对所述原始数据进行处理，得到脱敏处理后的数据，其中，所述预设的算法能够使得所述原始数据的统计量保持不变；输出所述脱敏处理后的数据。该方法实现简单，并且可以用于后续分析和利用。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理
，尤其涉及一种数据脱敏处理方法和装置。
技术介绍
在互联网大数据时代，数据的流动与合作至关重要。但同时，数据中的敏感信息一旦泄露，不但会造成用户权益受损，也带来公司商誉受损，引发信任危机。现有技术中，有几种数据脱敏处理算法，现有技术一是采用加密的方式，例如，对“年龄”进行加密，“32岁”变为“0x01234567”。现有技术二是对原始数据进行线性变换，令Y＝aX+b，Y是处理后的数据，X是原始数据，a和b是两个随机数。现有技术三是对原始数据进行分段处理，例如划分为20个段，每个段的取值用这个段的平均值或者中位数替代。但是，现有技术一数据加密后失去原始涵义，无法进行后续分析和利用，现有技术二的数据尺度发生变化，无法进行后续分析和利用，现有技术三根据不同场景需要修改分段边界，且修改会引起大量的工作量。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请的一个目的在于提出一种数据脱敏处理方法，该方法实现简单，并且可以用于后续分析和利用。本申请的另一个目的在于提出一种数据脱敏处理装置。为达到上述目的，本申请第一方面实施例提出的数据脱敏处理方法，包括：获取待处理的原始数据；采用预设的算法，对所述原始数据进行处理，得到脱敏处理后的数据，其中，所述预设的算法能够使得所述原始数据的统计量保持不变；输出所述脱敏处理后的数据。本申请第一方面实施例提出的数据脱敏处理方法，通过对原始数据进行预设算法的处理，可以使得脱敏处理后的数据与原始数据不同，实现数据脱敏，另一方面，由于预设的算法能够使得原始数据的统计量保持不变，使得后续...
数据脱敏处理方法和装置

【技术保护点】
一种数据脱敏处理方法，其特征在于，包括：获取待处理的原始数据；采用预设的算法，对所述原始数据进行处理，得到脱敏处理后的数据，其中，所述预设的算法能够使得所述原始数据的统计量保持不变；输出所述脱敏处理后的数据。

【技术特征摘要】
1.一种数据脱敏处理方法，其特征在于，包括：获取待处理的原始数据；采用预设的算法，对所述原始数据进行处理，得到脱敏处理后的数据，其中，所述预设的算法能够使得所述原始数据的统计量保持不变；输出所述脱敏处理后的数据。2.根据权利要求1所述的方法，其特征在于，所述采用预设的算法，对所述原始数据进行处理，得到脱敏处理后的数据，包括：采用如下公式，根据原始数据得到脱敏处理后的数据：Y＝(1+a％)*X；其中，X是原始数据，Y是脱敏处理后的数据，a是预设范围内的随机数。3.根据权利要求2所述的方法，其特征在于，所述a是[-p,p]范围内依据统计分布生成的随机数，其中，p根据所需数据脱敏的程度选择。4.根据权利要求1-3任一项所述的方法，其特征在于，所述获取待处理的原始数据，包括：根据身份标识类型数据，获取待处理的原始数据；在输出所述脱敏处理后的数据之前，对所述身份标识类型数据进行删除或者加密。5.根据权利要求1-3任一项所述的方法，其特征在于，所述输出所述脱敏处理后的数据之前，所述方法还包括：对所述脱敏处理后的数据，进行样本量限制。6.一种数据脱...

【专利技术属性】
技术研发人员：蔡佳良，张振宇，樊振华，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人