一种基于阿拉伯数字遮蔽的中文地址数据脱敏方法及装置制造方法及图纸

技术编号:21399712 阅读:34 留言:0更新日期:2019-06-19 07:11
本发明专利技术提供一种基于阿拉伯数字遮蔽的中文地址数据脱敏方法及装置,该方法采用如下步骤实现对中文地址中阿拉伯数字的遮蔽,输入中文地址字符串,将待脱敏的中文地址字符串输入至数据脱敏方法入口中,等待处理;识别中文地址字符串中的阿拉伯数字;使用遮蔽字符替换阿拉伯数字;输出脱敏后的中文地址字符串,将脱敏遮蔽后的中文地址字符串进行输出,方法结束。使用该方法可用于对地址数据的脱敏,且不影响用户画像、基于地理位置的分析等实际场景对地址精度的需求,在保护用户隐私和数据使用方面达到了较好的平衡点,可提升现有对中文地址脱敏方法的运行速率;同时本发明专利技术还提供了一种实现上述方法的装置。

【技术实现步骤摘要】
一种基于阿拉伯数字遮蔽的中文地址数据脱敏方法及装置
本专利技术涉及数据处理领域,具体而言,涉及对中文字符中的特定字符进行脱敏处理的领域。
技术介绍
随着大数据技术的发展,大数据平台越来越多为数据集中存储和数据深度挖掘分析提供平台支撑。然而大数据技术最初的设计并未完善的考虑其安全性,这些平台专注于发展数据处理能力,忽视了其他能力的发展,大数据平台作为一个分布式系统,承载了丰富的应用,集中了海量的数据,如何管理和保护这些数据充满了挑战。另一方面,大量的数据需要挖掘分析,过于封锁屏蔽数据无疑是对大数据平台的浪费,如何才能在信息便捷传递共享的基础上,对数据进行合理的处理,使数据隐私保护和数据挖掘分析达成合理的平衡点,也是当下需要重点解决的问题。中华人民共和国网络安全法第42条规定:“网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外”。中文地址数据可用于用户画像等数据分析场景,但其必须是经过数据脱敏处理后方可用于数据分析。数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护,这样本文档来自技高网...

【技术保护点】
1.一种基于阿拉伯数字遮蔽的中文地址数据脱敏方法,其特征在于,该方法包括如下步骤:输入中文地址字符串,将待脱敏的中文地址字符串输入至数据脱敏方法入口中,等待处理;识别中文地址字符串中的阿拉伯数字;使用遮蔽字符替换阿拉伯数字;输出脱敏后的中文地址字符串,将脱敏遮蔽后的中文地址字符串进行输出,方法结束。

【技术特征摘要】
1.一种基于阿拉伯数字遮蔽的中文地址数据脱敏方法,其特征在于,该方法包括如下步骤:输入中文地址字符串,将待脱敏的中文地址字符串输入至数据脱敏方法入口中,等待处理;识别中文地址字符串中的阿拉伯数字;使用遮蔽字符替换阿拉伯数字;输出脱敏后的中文地址字符串,将脱敏遮蔽后的中文地址字符串进行输出,方法结束。2.根据权利要求1所述的方法,其特征在于:在所述识别中文地址字符串中的阿拉伯数字步骤中,使用判定逻辑对输入的中文地址字符串中的文字进行逐一识别,记录其中的阿拉伯数字的具体位置,并将位置存于数组A中。3.根据权利要求2所述的方法,其特征在于,在所述使用遮蔽字符替换阿拉伯...

【专利技术属性】
技术研发人员:程国艮李欣杰
申请(专利权)人:中译语通科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1