数据去标识化方法、装置、设备及存储介质制造方法及图纸

技术编号:23672140 阅读:50 留言:0更新日期:2020-04-04 17:40
本发明专利技术公开一种数据去标识化方法、装置、设备及存储介质。该方法包括:当源端服务器发生数据更新并生成数据库日志文件时,目标服务器接收所述源端服务器主动推送的所述数据库日志文件;当所述目标服务器接收到所述源端服务器发送的所述数据库日志文件后,所述目标服务器基于预配置的应用进程,对所述数据库日志文件进行解析以解析出所述数据库日志文件中的标识化数据,对所述标识化数据进行去标识化处理,并将去标识数据存入所述目标服务器的目标数据库中。根据本发明专利技术提供的数据去标识化方法,能够在数据应用之前完成大数据量的同步存储及去标识,无需对应用程序进行去标识化配置,有效地节约了开发成本。

Data De identification method, device, equipment and storage medium

【技术实现步骤摘要】
数据去标识化方法、装置、设备及存储介质
本专利技术涉及计算机
,尤其涉及一种数据去标识化方法、装置、电子设备及计算机可读存储介质。
技术介绍
近年来,随着信息技术的快速发展,大数据实现共享的同时带来了个人隐私泄露等信息安全问题。例如,医疗机构间共享含有患者姓名、电话、证件号码等信息的原始医疗数据,过程中一旦发生泄漏或被非法窃取,将给患者的健康和财产带来巨大损失,甚至危及国家安全。因此,目前的大数据应用场景对于数据去标识化的需求愈发强烈。现阶段的去标识化进程通常在应用层执行,然而在应用程序的基础上进行去标识配置的难度极大,需要大量修改程序代码。再者,应用程序尚无法在接收大数据量的同时对其完成同步去标识。需要说明的是,在所述
技术介绍
部分公开的上述信息仅用于加强对本专利技术的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此,本专利技术提供一种数据去标识化方法、装置、电子设备及计算机可读存储介质。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利本文档来自技高网...

【技术保护点】
1.一种数据去标识化方法,其特征在于,包括:/n当源端服务器发生数据更新并生成数据库日志文件时,目标服务器接收所述源端服务器主动推送的所述数据库日志文件;/n当所述目标服务器接收到所述源端服务器发送的所述数据库日志文件后,所述目标服务器基于预配置的应用进程,对所述数据库日志文件进行解析以解析出所述数据库日志文件中的标识化数据,对所述标识化数据进行去标识化处理,并将去标识数据存入所述目标服务器的目标数据库中。/n

【技术特征摘要】
20200204 CN 202010079690X1.一种数据去标识化方法,其特征在于,包括:
当源端服务器发生数据更新并生成数据库日志文件时,目标服务器接收所述源端服务器主动推送的所述数据库日志文件;
当所述目标服务器接收到所述源端服务器发送的所述数据库日志文件后,所述目标服务器基于预配置的应用进程,对所述数据库日志文件进行解析以解析出所述数据库日志文件中的标识化数据,对所述标识化数据进行去标识化处理,并将去标识数据存入所述目标服务器的目标数据库中。


2.根据权利要求1所述的方法,其特征在于,所述目标服务器基于预配置的应用进程,对所述数据库日志文件进行解析以解析出所述数据库日志文件中的标识化数据包括:
所述目标服务器基于预配置的第一应用进程,对所述数据库日志文件中的所述源端服务器的更新数据是否包括标识化数据进行识别;
当识别出所述更新数据包括标识化数据时,所述目标服务器基于预配置的第二应用进程,解析出所述标识化数据。


3.根据权利要求1所述的方法,其特征在于,在将去标识数据存入所述目标服务器的目标数据库中之后,所述方法还包括:
所述目标服务器接收终端的操作指令;
所述目标服务器根据所述操作指令,将所述操作指令对应的去标识数据发送给所述终端。


4.根据权利要求1所述的方法,其特征在于,对所述标识化数据进行去标识化处理包括:
对所述标识化数据进行脱敏处理,获得所述标识化数据对应的脱敏数据;以及
对所述脱敏数据进行去标识化处理,获得所述标识化数据对应...

【专利技术属性】
技术研发人员:孙同乐
申请(专利权)人:医渡云北京技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1