数据脱敏方法及装置制造方法及图纸

技术编号:21772390 阅读:71 留言:0更新日期:2019-08-03 21:45
本公开是关于一种数据脱敏方法及装置。该方法包括:获取待脱敏数据的码点数组;根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码,在确定所述待脱敏数据的首字符和/或尾字符为目标码时,将目标码确定为对应的脱敏数据的首字符和/或尾字符;所述目标码包括统一码的非基本多语言平面的字符或者表情;根据预设字符串和所述目标码确定所述脱敏数据。该技术方案将表情或者统一码的非基本多语言平面的字符整体对应的作为脱敏数据的首字符或者尾字符,避免形成的脱敏数据乱码,提高了脱敏的准确性。

Data desensitization method and device

【技术实现步骤摘要】
数据脱敏方法及装置
本公开涉及计算机
,尤其涉及一种数据脱敏方法及装置。
技术介绍
目前,互联网中的用户隐私信息越来越重要,用户昵称作为用户的一种标识,为了保护用户隐私的安全,需要针对性的对用户昵称做脱敏处理。相关技术中,在对用户昵称做脱敏处理时,首先将用户昵称转换为多个码点,一个字符对应一个码点,然后提取第一个码点作为脱敏文本的首字符,提取最后一个码点作为脱敏文本的尾字符,再在脱敏文本的首字符和尾字符之间增加***,则构成的脱敏文本为首字符***尾字符。
技术实现思路
为克服相关技术中存在的问题,本公开实施例提供一种数据脱敏方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种数据脱敏方法,包括:获取待脱敏数据的码点数组;所述码点数组中的码点包括统一码的码点;根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码,在确定所述待脱敏数据的首字符和/或尾字符为目标码时,将目标码确定为对应的脱敏数据的首字符和/或尾字符;所述目标码包括统一码的非基本多语言平面的字符或者表情;根据预设字符串和所述目标码确定所述脱敏数据。本公开的实施例提供的技术方案可以包括以下有益效果:在获取到待脱敏数据时,需要确定待脱敏数据的首字符和尾字符是否为表情或者统一码的非基本多语言平面的字符,在确定待脱敏数据的首字符和尾字符为表情或者统一码的非基本多语言平面的字符时,则将表情或者统一码的非基本多语言平面的字符整体对应的作为脱敏数据的首字符或者尾字符,避免形成的脱敏数据乱码,提高了脱敏的准确性。在一个实施例中,在根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码之前,还包括:确定所述待脱敏数据中是否包含所述首字符和尾字符;所述根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码包括:在确定所述待脱敏数据中包含所述首字符和所述尾字符时,根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码。在一个实施例中,还包括:在确定所述待脱敏数据中只包含首字符时,确定所述待脱敏数据的首字符是否为目标码。在一个实施例中,还包括:在确定所述待脱敏数据的首字符和/或尾字符为非目标码时,将所述非目标码确定为对应的脱敏数据的首字符和/或尾字符。在一个实施例中,根据所述码点数组确定所述待脱敏数据的首字符是否为目标码,在确定所述待脱敏数据的首字符为目标码时,将目标码确定为对应的脱敏数据的首字符包括:获取所述码点数组中的初始码点作为第一当前码点组;确定表情数据库中是否存储有与所述第一当前码点组中每个码点对应的表情;在确定所述表情数据库中未存储有所述第一当前码点组中每个码点对应的表情时,将所述第一当前码点组和下一码点作为新的第一当前码点组,并返回执行步骤确定表情数据库中是否存储有与所述第一当前码点组中每个码点对应的表情,直至所述第一当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情;在确定所述表情数据库中存储有与所述第一当前码点组中每个码点对应的表情时,确定所述第一当前码点组中的最后一个码点是否为数据结束码点;在确定所述第一当前码点组中的最后一个码点为非数据结束码点时,将所述第一当前码点组确定为所述脱敏数据的首字符。在一个实施例中,根据所述码点数组确定所述待脱敏数据的尾字符是否为目标码,在确定所述待脱敏数据的尾字符为目标码时,将目标码确定为对应的脱敏数据的尾字符包括:在所述第一当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情,或者,在确定所述第一当前码点组中的最后一个码点为非数据结束码点时,获取所述码点数组中的终止码点作为第二当前码点组;确定所述表情数据库中是否存储有与所述第二当前码点组中每个码点对应的表情;在确定所述表情数据库中未存储有与所述第二当前码点组中每个码点对应的表情时,将前一码点和所述第二当前码点组按顺序排列作为新的第二当前码点组,并返回执行步骤确定所述表情数据库中是否存储有与所述第二当前码点组中每个码点对应的表情,直至所述第二当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情;在确定所述表情数据库中存储有与所述第二当前码点组中每个码点对应的表情时,将所述第二当前码点组确定为所述脱敏数据的尾字符。在一个实施例中,还包括:在确定所述第一当前码点组中的最后一个码点为数据结束码点时,将所述第一当前码点组确定为所述脱敏数据的首字符。在一个实施例中,在所述第一当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情时,还包括:确定所述第一当前码点组中的第一个码点是否在高位代理区;在确定所述第一当前码点组中的第一个码点在所述高位代理区时,确定所述第一当前码点组中的第二个码点是否在低位代理区;在确定所述第一当前码点组中的第二个码点在所述低位代理区时,将所述第一当前码点组中的第一个码点和所述第二个码点确定为所述脱敏数据的首字符。在一个实施例中,还包括:在确定所述第一当前码点组中的第一个码点未在所述高位代理区时,将所述第一当前码点组中的第一个码点确定为脱敏数据的首字符。在一个实施例中,在所述第二当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情时,还包括:确定所述第二当前码点组中的第一个码点是否在高位代理区;在确定所述第二当前码点组中的第一个码点在所述高位代理区时,确定所述第二当前码点组中的第二个码点是否在低位代理区;在确定所述第二当前码点组中的第二个码点在所述低位代理区时,将所述第二当前码点组中的第一个码点和所述第二个码点确定为所述脱敏数据的尾字符。在一个实施例中,还包括:在确定所述第二当前码点组中的第二个码点未在所述低位代理区时,将所述第二当前码点组中的第二个码点确定为脱敏数据的尾字符。根据本公开实施例的第二方面,提供一种数据脱敏装置,包括:获取模块,用于获取待脱敏数据的码点数组;所述码点数组中的码点包括统一码的码点;第一确定模块,用于根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码,在确定所述待脱敏数据的首字符和/或尾字符为目标码时,将目标码确定为对应的脱敏数据的首字符和/或尾字符;所述目标码包括统一码的非基本多语言平面的字符或者表情;第二确定模块,用于根据预设字符串和所述目标码确定所述脱敏数据。本公开的实施例提供的技术方案可以包括以下有益效果:在获取到待脱敏数据时,需要确定待脱敏数据的首字符和尾字符是否为表情或者统一码的非基本多语言平面的字符,在确定待脱敏数据的首字符和尾字符为表情或者统一码的非基本多语言平面的字符时,则将表情或者统一码的非基本多语言平面的字符整体对应的作为脱敏数据的首字符或者尾字符,避免形成的脱敏数据乱码,提高了脱敏的准确性。在一个实施例中,还包括第三确定模块,所述第一确定模块包括第一确定子模块;所述第三确定模块,用于确定所述待脱敏数据中是否包含所述首字符和尾字符;所述第一确定子模块,用于在确定所述待脱敏数据中包含所述首字符和所述尾字符时,根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码。在一个实施例中,还包括第四确定模块;所述第四确定模块,用于在确定所述待脱敏本文档来自技高网...

【技术保护点】
1.一种数据脱敏方法,其特征在于,包括:获取待脱敏数据的码点数组;所述码点数组中的码点包括统一码的码点;根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码,在确定所述待脱敏数据的首字符和/或尾字符为目标码时,将目标码确定为对应的脱敏数据的首字符和/或尾字符;所述目标码包括统一码的非基本多语言平面的字符或者表情;根据预设字符串和所述目标码确定所述脱敏数据。

【技术特征摘要】
1.一种数据脱敏方法,其特征在于,包括:获取待脱敏数据的码点数组;所述码点数组中的码点包括统一码的码点;根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码,在确定所述待脱敏数据的首字符和/或尾字符为目标码时,将目标码确定为对应的脱敏数据的首字符和/或尾字符;所述目标码包括统一码的非基本多语言平面的字符或者表情;根据预设字符串和所述目标码确定所述脱敏数据。2.根据权利要求1所述的方法,其特征在于,在根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码之前,还包括:确定所述待脱敏数据中是否包含所述首字符和尾字符;所述根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码包括:在确定所述待脱敏数据中包含所述首字符和所述尾字符时,根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码。3.根据权利要求2所述的方法,其特征在于,还包括:在确定所述待脱敏数据中只包含首字符时,确定所述待脱敏数据的首字符是否为目标码。4.根据权利要求1所述的方法,其特征在于,还包括:在确定所述待脱敏数据的首字符和/或尾字符为非目标码时,将所述非目标码确定为对应的脱敏数据的首字符和/或尾字符。5.根据权利要求1所述的方法,其特征在于,根据所述码点数组确定所述待脱敏数据的首字符是否为目标码,在确定所述待脱敏数据的首字符为目标码时,将目标码确定为对应的脱敏数据的首字符包括:获取所述码点数组中的初始码点作为第一当前码点组;确定表情数据库中是否存储有与所述第一当前码点组中每个码点对应的表情;在确定所述表情数据库中未存储有所述第一当前码点组中每个码点对应的表情时,将所述第一当前码点组和下一码点作为新的第一当前码点组,并返回执行步骤确定表情数据库中是否存储有与所述第一当前码点组中每个码点对应的表情,直至所述第一当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情;在确定所述表情数据库中存储有与所述第一当前码点组中每个码点对应的表情时,确定所述第一当前码点组中的最后一个码点是否为数据结束码点;在确定所述第一当前码点组中的最后一个码点为非数据结束码点时,将所述第一当前码点组确定为所述脱敏数据的首字符。6.根据权利要求5所述的方法,其特征在于,根据所述码点数组确定所述待脱敏数据的尾字符是否为目标码,在确定所述待脱敏数据的尾字符为目标码时,将目标码确定为对应的脱敏数据的尾字符包括:在所述第一当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情,或者,在确定所述第一当前码点组中的最后一个码点为非数据结束码点时,获取所述码点数组中的终止码点作为第二当前码点组;确定所述表情数据库中是否存储有与所述第二当前码点组中每个码点对应的表情;在确定所述表情数据库中未存储有与所述第二当前码点组中每个码点对应的表情时,将前一码点和所述第二当前码点组按顺序排列作为新的第二当前码点组,并返回执行步骤确定所述表情数据库中是否存储有与所述第二当前码点组中每个码点对应的表情,直至所述第二当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情;在确定所述表情数据库中存储有与所述第二当前码点组中每个码点对应的表情时,将所述第二当前码点组确定为所述脱敏数据的尾字符。7.根据权利要求5所述的方法,其特征在于,还包括:在确定所述第一当前码点组中的最后一个码点为数据结束码点时,将所述第一当前码点组确定为所述脱敏数据的首字符。8.根据权利要求6所述的方法,其特征在于,在所述第一当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情时,还包括:确定所述第一当前码点组中的第一个码点是否在高位代理区;在确定所述第一当前码点组中的第一个码点在所述高位代理区时,确定所述第一当前码点组中的第二个码点是否在低位代理区;在确定所述第一当前码点组中的第二个码点在所述低位代理区时,将所述第一当前码点组中的第一个码点和所述第二个码点确定为所述脱敏数据的首字符。9.根据权利要求8所述的方法,其特征在于,还包括:在确定所述第一当前码点组中的第一个码点未在所述高位代理区时,将所述第一当前码点组中的第一个码点确定为脱敏数据的首字符。10.根据权利要求6所述的方法,其特征在于,在所述第二当前码点组包括所述码点数组中的所有码点,且所述表情数据库中未存储有与所述所有码点对应的表情时,还包括:确定所述第二当前码点组中的第一个码点是否在高位代理区;在确定所述第二当前码点组中的第一个码点在所述高位代理区时,确定所述第二当前码点组中的第二个码点是否在低位代理区;在确定所述第二当前码点组中的第二个码点在所述低位代理区时,将所述第二当前码点组中的第一个码点和所述第二个码点确定为所述脱敏数据的尾字符。11.根据权利要求10所述的方法,其特征在于,还包括:在确定所述第二当前码点组中的第二个码点未在所述低位代理区时,将所述第二当前码点组中的第二个码点确定为脱敏数据的尾字符。12.一种数据脱敏装置,其特征在于,包括:获取模块,用于获取待脱敏数据的码点数组;所述码点数组中的码点包括统一码的码点;第一确定模块,用于根据所述码点数组确定所述待脱敏数据的首字符和尾字符是否为目标码,在确定所述待脱敏数据的首字符和/或尾字符为目标码时,将目标码确定为对应的脱敏数据的首字符和/或尾字符;所述目标码包括统一码的非基本多语言平面的字符或者表情;第二确定模块,用于根据预设字符串和所述目标码确定所述脱敏数据。13.根据权利要求12所述的装置,其特征在于,还包括第三确定模块,所述第一确定模块包括第一确定子模块;所述第三确定模块,用于确定所述待脱敏数据中是否包含所述首字符和尾字符;所述第一确定子模块,用于在确定所述待脱敏...

【专利技术属性】
技术研发人员:赵福利李然
申请(专利权)人:北京口袋时尚科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1