The invention discloses a data desensitization method, which generates a user-defined data model according to data characteristics. We use hash algorithm to desensitize data, and then generate highly simulated desensitization data according to the user-defined data model.
【技术实现步骤摘要】
一种基于哈希算法的高仿真数据脱敏算法
本专利技术涉及一种新的数据脱敏算法——基于哈希算法的高仿真数据脱敏算法。
技术介绍
大数据分析需要将大量的数据进行整合,从而得以充分的从数据中挖掘隐藏的价值,挖掘出的信息将为业务部门提供有效的决策依据,从而提高生产效率,创造价值。但是,用于进行数据分析的数据中可能包括个人隐私数据以及敏感信息,例如身份证信息,酒店入住纪录,用户支付信息等,这些数据一旦泄露将涉及个人隐私安全。现有的大数据平台一般通过用户认证,权限管理以及数据加密等方式确保数据安全。可是,以上方式并不能完全保证数据不被获取,破解。一方面,任何数据存储流通环节中的参与人员,均可能存在导致数据泄漏的风险。另一方面,那些没有访问用户数据权限的人员,也可能有存在对该数据进行分析与挖掘的需求,数据的访问权限的限制,将导致数据价值无法得到充分利用。数据脱敏需要对数据进行漂白,消除数据中的敏感内容。与此同时,在对数据进行脱敏的同时,需保证脱敏后的数据可用性,并在一定范围内保证恶意攻击者无法将数据与具体用户关联到一起,从而保证用户数据的隐私性。数据脱敏方案是大数据平台整体数据安全解决方案的重要组成部分,是构建安全可靠的大数据平台必不可少的功能特性。
技术实现思路
专利技术目的:本专利技术针对数据脱敏的需求,提出一种新的数据脱敏算法——基于哈希算法的高仿真数据脱敏算法。既保证了消除数据中的敏感内容,使得数据与原始数据相似,也保留了数据脱的原始特征,保证脱敏后的可用性。技术方案:本专利技术使用 ...
【技术保护点】
1.一种基于哈希算法的高仿真数据脱敏算法,其特征在于定义一种新的数据脱敏方式——利用哈希算法进行数据脱敏,利用被脱敏数据的数据特征,结合上述两点实现数据的高仿真脱敏。/n
【技术特征摘要】
1.一种基于哈希算法的高仿真数据脱敏算法,其特征在于定义一种新的数据脱敏方式——利用哈希算法进行数据脱敏,利用被脱敏数据的数据特征,结合上述两点实现数据的高仿真脱敏。
2.一种基于哈希算法的高仿真数据脱敏算法,其特征在于提出使用使用哈希算法应用于数据脱敏,即使用不可逆的哈希算法对进数据脱敏,对权利要求1进行数据的某些特征进行哈希计算。
3.一种基于哈希算法的高仿真数据脱敏算法,其特征在于利用真实数据来生成脱敏结果,即使用真实数据对权...
【专利技术属性】
技术研发人员:陈广,高阳,
申请(专利权)人:南京大学,江苏万维艾斯网络智能产业创新中心有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。