The present invention provides a device and method for sensitive data recognition and desensitization. The device comprises an input unit for obtaining the target data to be desensitized in response to the current triggered data desensitization request, and the identification unit for identifying whether the target data to be desensitized is sensitive data, and if then, the data desensitization unit is executed. Otherwise, the output unit is executed directly; the data desensitization unit is used to perform desensitization operation on target data that has been identified as sensitive data, and the output unit is used to output the target data that is not sensitive after processing. The beneficial effect of the invention is that using the NBM classifier to recognize the sensitive data and avoid the calculation burden on the desensitization operation of the non sensitive data, the sensitive data is desensitized by the combination of the deformation and exchange, and the data of the small part of the sensitive data is only required to carry out the data according to the desensitization rule. Deformation, and then use exchange to desensitization all data, greatly reducing the amount of computation.
【技术实现步骤摘要】
一种敏感数据识别和脱敏的装置及方法
本专利技术涉及信息安全领域,尤其涉及一种敏感数据识别和脱敏的装置及方法。
技术介绍
随着信息技术的高速发展,信息安全问题日益突出。而商业银行作为国家经济发展核心支撑命脉的金融系统之一,其安全性备受全社会关注。随着各类金融业务的快速发展,业务生产系统积累了大量账户、交易、经营管理等敏感信息的数据。如果这些敏感数据发生泄漏,不仅会让客户的个人隐私及账户安全受到威胁,而且也可能给银行的业务运营和系统运营安全带来隐患。所以敏感数据的保护成为商业银行信息安全管理的重点。为了使敏感数据得到保护,需要对这些数据进行脱敏处理,以使其丧失敏感性后再运用到开发和测试环境中,避免敏感数据的泄漏。数据脱敏,是指对某些敏感信息通过脱敏规则进行数据的变形。但是由于商业银行数据的庞大,如果要对每一条数据都按照一定的脱敏规则进行脱敏,运算量大且效率较低,鉴于此,在进行数据脱敏前对数据进行识别并对脱敏规则进行改进是非常有必要的。鉴于上述缺陷,本专利技术创作者经过长时间的研究和实践终于获得了本专利技术。
技术实现思路
为解决上述问题,本专利技术采用的技术方案在于,一方 ...
【技术保护点】
1.一种敏感数据识别和脱敏的装置,其特征在于,包括:输入单元、识别单元、数据脱敏单元和输出单元;所述输入单元,用于响应当前触发的数据脱敏请求,获取待脱敏的目标数据;所述识别单元,用于识别所述待脱敏的目标数据是否为敏感数据,若是,则执行所述数据脱敏单元,否则直接执行所述输出单元;所述数据脱敏单元,用于对已识别为所述敏感数据的目标数据执行脱敏操作;所述输出单元,用于输出处理后不具敏感性的目标数据。
【技术特征摘要】
1.一种敏感数据识别和脱敏的装置,其特征在于,包括:输入单元、识别单元、数据脱敏单元和输出单元;所述输入单元,用于响应当前触发的数据脱敏请求,获取待脱敏的目标数据;所述识别单元,用于识别所述待脱敏的目标数据是否为敏感数据,若是,则执行所述数据脱敏单元,否则直接执行所述输出单元;所述数据脱敏单元,用于对已识别为所述敏感数据的目标数据执行脱敏操作;所述输出单元,用于输出处理后不具敏感性的目标数据。2.根据权利要求1所述的敏感数据识别和脱敏的装置,其特征在于,所述识别单元,包括预处理子单元、机器学习子单元和判断子单元;所述预处理子单元,用于特征提取,将训练集中的数据表征出来;所述机器学习子单元,其利用NBM在所述训练集上进行机器学习后得到分类器;所述判断子单元,其将输入的数据用所述预处理子单元构建的特征向量表征出来后用所述分类器进行分类,判定是否为敏感数据。3.根据权利要求2所述的敏感数据识别和脱敏的装置,其特征在于,所述预处理子单元,包括分离模块,构建模块和表征模块;所述分离模块,用于读取历史数据作为所述训练集,并从所述训练集中分离部分数据作为测试集;所述构建模块,用于构建所述训练集中数据的特征向量;所述表征模块,用于根据构建好的所述特征向量将所述训练集中的数据表征出来。4.根据权利要求3所述的敏感数据识别和脱敏的装置,其特征在于,所述机器学习子单元,包括第一计算模块、第二计算模块和测试与评价模块;所述第一计算模块,假设所述训练集={(x1,c1),...,(xn,cn)}包含n条数据,其中表示第i条数据的特征向量,a1,...,aM为所述预处理子单元提取的特征属性,ci∈{0,1}表示第i条数据的类别,0表示该数据为敏感数据,1表示该数据为非敏感数据,计算类别c=0和c=1的先验概率:所述第二计算模块,计算某个特征属性xj=ak分别在类别c=0和c=1下的条件概率:所述测试与评价模块,用于在所述测试集上进行测试和评价。5.根据权利要求4所述的敏感数据识别和脱敏的装置,其特征在于,所述测试与评价模块包括读取子模块、计算子模块、确定子模块和比较子模块;所述读取子模块,用于读取所述测试集上的一条数据X,并表征成特征向量;所述计算子模块,分别计算类别c=0和c=1在所述数据X下的后验概率:由于P(X)对于类别c=0和c=1为常数,所以只需计算分子的概率;所述确定子模块,用于确定所述数据X属于的分类c:c=argmaxP(c=ck|X);所述比较子模块,用于对所述测试集中的每一条数据重复所述读取子模块、所述计算子模块和所述确定子模块,并与给定的分类进行比较,得到误分类率,若所述误分类率在设定范围内,则生成所...
【专利技术属性】
技术研发人员:黄超,李青海,潘宇翔,王平,张晓亭,杨婉,
申请(专利权)人:广东精点数据科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。