【技术实现步骤摘要】
一种面向隐私计算的敏感数据识别与脱敏方法
[0001]本专利技术涉及数据安全
,尤其涉及一种面向隐私计算的敏感数据识别与脱敏方法。
技术介绍
[0002]隐私计算平台的数据库中保存着来自业务系统的敏感数据,这些数据将与对端的隐私计算节点的数据进行联合计算,从而得出结果。而隐私计算的数据库中的这些数据在运维期间,还是可以被运维人员或开发人员访问,从而引起敏感数据泄露。而本专利技术通过代理方式屏蔽了外界与数据库之间的访问,并针对敏感数据访问进行脱敏处理,防止敏感数据泄露。
[0003]针对敏感数据识别,目前技术大部分采用关键字或正则匹配的方式,其识别准确率不高,本专利技术提出了一种基于自然语言深度学习算法+自定义挖掘脚本方法来进行敏感数据识别,提高了识别准确率。
[0004]目前数据脱敏技术的实现大部分是在数据库中立脱敏视图,在数据库查询SQL被代理端截获后,将SQL中的查询的表名改成此视图名称,从而实现对查询数据的脱敏。这种实现方式很难做到高效的动态脱敏,对数据库的侵入较大,每个脱敏表都需要建立对应的脱敏 ...
【技术保护点】
【技术特征摘要】
1.一种面向隐私计算的敏感数据识别与脱敏方法,其特征在于:设计包括管理中心服务、高可用代理、数据代理服务3个部分的系统实现面向隐私计算的敏感数据识别与脱敏,首先管理中心服务由管理员维护各个数据库脱敏函数,并将脱敏函数内容设置到对应的数据库中;然后再结合脱敏函数,维护脱敏规则,在规则中确定使用的脱敏函数名称内容,并将脱敏规则下发给数据库代理服务;数据库代理服务在将中心服务下发的脱敏规则加载后,对捕获到的每条数据库SQL访问请求,解析sql语句内容,获得请求SQL的用户,库表信息,结合中心端配置的脱敏规则,对当前请求进行验证,当判断出当前请求需要进行脱敏处理,则对当前请求进行脱敏处理,进而将当前sql中需要防护的字段替换成脱敏函数,形成新的请求sq l,并重新加工sql请求报文,转发给后端的数据库,最后由数据库执行脱敏函数,并返回脱敏后的数据给业务系统。2.如权利要求1所述的一种面向隐私计算的敏感数据识别与脱敏方法,其特征在于:所述脱敏处理的具体方法为:首先设计基于自然语言深度学习算法加自定义挖掘脚本的敏感数据识别方法识别敏感数据,之后设计基于嵌入数据库脱敏函数的动态脱敏方法进行脱敏操作。3.如权利要求2所述的一种面向隐私计算的敏感数据识别与脱敏方法,其特征在于:所述设计基于自然语言深度学习算法加自定义挖掘脚本的敏感数据识别方法的具体流程为:首先,采集业务数据:通过中心服务端维护的数据库信息,定量采集业务数据到本地,供数据识别算法进行分析;之后,遍历业务数据:循环遍历每一条业务数据,利用数据识别算法对业务数据进行识别;接着遍历当前业务数据记录:循环遍历当前采集的业务数据;之后识别当前业务一条数据:在循环过程中对每一...
【专利技术属性】
技术研发人员:刘旭东,李博,薛晨,刘永生,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。