一种敏感数据统计方法及相关装置制造方法及图纸

技术编号:28374731 阅读:38 留言:0更新日期:2021-05-08 00:02
本申请公开了一种敏感数据统计方法,包括:对接收到的原始数据进行源数据匹配,得到对应的注册信息;根据注册信息对应的脱敏策略对原始数据进行脱敏处理,得到脱敏数据,并存储至业务库;根据与脱敏数据匹配的注册信息对业务库中的脱敏数据进行识别并统计,得到统计结果。通过对接收到的原始数据进行源数据匹配,得到与源数据类别对应的注册信息,进一步采用该注册信息对应的脱敏策略进行数据脱敏,最后采用与脱敏数据匹配的注册信息对脱敏数据的敏感数据类型进行识别,进一步再进行统计,实现了对敏感数据脱敏后再进行统计。本申请还公开了一种敏感数据统计装置、服务器以及计算机可读存储介质,具有以上有益效果。

【技术实现步骤摘要】
一种敏感数据统计方法及相关装置
本申请涉及数据处理
,特别涉及一种敏感数据统计方法、敏感数据统计装置、服务器以及计算机可读存储介质。
技术介绍
随着信息技术的不断发展,在互联网环境中出现了越来越多的数据,大数据概念孕育而生。大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。其中,在对数据进行处理的过程中,需要将数据交由专业的数据处理平台和专业的数据处理人员来对数据进行分析和挖掘,以输出有价值的结果。然而在数据处理过程中,数据处理方由于管理因素或其它利益因素,经常会利用数据中与挖掘目标无关的敏感信息进获利,如:涉及个人信息的姓名、电话、住址、身份证号、银行卡号等;涉及企业信息的购方信息、交易金额等,进而造成个人隐私或商业敏感信息的泄漏。因此,在对数据进行处理的过程中,需要将数据进行脱敏处理。相关技术中,存在多种数据脱敏方式。其中,文本数据脱敏是根据预设词典或正则方式自动识别敏感数据类型和脱敏的处理方式。该方式是对所有已确定是敏感数据的内容进行脱敏,脱敏粒度较粗,无法通过敏感数据上下文关系进行筛选脱敏。此外,SQL(StructuredQueryLanguage,结构化查询语言)脱敏是指定敏感数据所在列,通过SQL查询涉及到该列的数据结果进行过滤以实现脱敏。该方式虽然可以对列数据进行指定脱敏,但脱敏后数据不能用来做数据分析,风控审计等场景。最后,通过加密、解密方式对原始数据进行脱敏和恢复,虽然可以支撑数据安全产品的风控分析和审计等业务场景,但是只要有脱敏数据恢复的动作就会存在敏感数据泄漏的风险。可见,以上对数据进行脱敏的方式都不同程度的存在脱敏颗粒度较大的问题,降低了数据在脱敏处理进行统计的效果,使得无法进行数据统计。因此,如何避免脱敏后数据无法进行数据统计是本领域技术人员关注的重点问题。
技术实现思路
本申请的目的是提供一种敏感数据统计方法、敏感数据统计装置、服务器以及计算机可读存储介质,通过对接收到的原始数据进行源数据匹配,得到与源数据类别对应的注册信息,进一步采用该注册信息对应的脱敏策略进行数据脱敏,最后采用与脱敏数据匹配的注册信息对脱敏数据的敏感数据类型进行识别,进一步再进行统计,实现了对敏感数据脱敏后再进行统计,保持敏感数据安全性,避免无法数据统计的问题。为解决上述技术问题,本申请提供一种敏感数据统计方法,包括:对接收到的原始数据进行源数据匹配,得到对应的注册信息;其中,注册信息是根据源数据类别对原始源数据进行注册得到的;根据所述注册信息对应的脱敏策略对所述原始数据进行脱敏处理,得到脱敏数据,并存储至业务库;其中,所述脱敏策略是对注册信息进行策略配置得到的执行策略;根据与脱敏数据匹配的注册信息对所述业务库中的脱敏数据进行识别并统计,得到统计结果。可选的,根据与脱敏数据匹配的注册信息对所述业务库中的脱敏数据进行识别并统计,得到统计结果,包括:根据预设标识字符提取所述业务库中多个脱敏数据的脱敏字符串;对每个所述脱敏字符串的第一元素进行匹配,得到对应的注册信息;对注册信息中敏感数据类型相同的脱敏字符串的第二元素进行统计,得到该敏感数据类型对应的数据统计结果。可选的,对注册信息中敏感数据类型相同的脱敏字符串的第二元素进行统计,得到该敏感数据类型对应的数据统计结果,包括:将注册信息中敏感数据类型相同的脱敏字符串的第二元素添加至集合中;对所述集合进行去重处理,得到去重集合;将所述去重集合的元素总数作为该敏感数据类型对应的数据统计结果。可选的,对接收到的原始数据进行源数据匹配,得到对应的注册信息,包括:根据多个注册信息的源数据字段对所述原始数据进行匹配,确定所述对应的注册信息。可选的,所述脱敏策略包括筛选条件、脱敏字段、脱敏模式以及脱敏方式;可选的,根据所述注册信息对应的脱敏策略对所述原始数据进行脱敏处理,得到脱敏数据,并存储至业务库,包括:根据所述注册信息对应的脱敏策略的脱敏内容对所述原始数据进行提取,得到待脱敏字段;根据所述脱敏策略的脱敏模式和脱敏方式对所述待脱敏字段进行脱敏处理,得到所述脱敏数据;将所述脱敏数据存入所述业务库。可选的,根据所述脱敏策略的脱敏模式和脱敏方式对所述待脱敏字段进行脱敏处理,得到所述脱敏数据,包括:当所述脱敏模式为部分脱敏时,对所述待脱敏字段进行正则匹配,得到部分脱敏字段;对所述部分脱敏字段进行加密计算,得到所述脱敏数据。本申请还提供一种敏感数据统计装置,包括:匹配模块,用于对接收到的原始数据进行源数据匹配,得到对应的注册信息;其中,注册信息是根据源数据类别对原始源数据进行注册得到的;脱敏处理模块,用于根据所述注册信息对应的脱敏策略对所述原始数据进行脱敏处理,得到脱敏数据,并存储至业务库;其中,所述脱敏策略是对注册信息进行策略配置得到的执行策略;数据统计模块,用于根据与脱敏数据匹配的注册信息对所述业务库中的脱敏数据进行识别并统计,得到统计结果。本申请还提供一种服务器,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上所述的敏感数据统计方法的步骤。本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的敏感数据统计方法的步骤。本申请所提供的一种敏感数据统计方法,包括:对接收到的原始数据进行源数据匹配,得到对应的注册信息;其中,注册信息是根据源数据类别对原始源数据进行注册得到的;根据所述注册信息对应的脱敏策略对所述原始数据进行脱敏处理,得到脱敏数据,并存储至业务库;其中,所述脱敏策略是对注册信息进行策略配置得到的执行策略;根据与脱敏数据匹配的注册信息对所述业务库中的脱敏数据进行识别并统计,得到统计结果。通过对接收到的原始数据进行源数据匹配,得到与源数据类别对应的注册信息,进一步采用该注册信息对应的脱敏策略进行数据脱敏,最后采用与脱敏数据匹配的注册信息对脱敏数据的敏感数据类型进行识别,进一步再进行统计,实现了对敏感数据脱敏后再进行统计,保持敏感数据安全性,避免无法数据统计的问题。本申请还提供一种敏感数据统计装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例所提供的一种敏感数据统计方法的流程图;图2为本申请实施例所提供的一种敏感数据统计装置的结构示意图。具体实施方式本申请本文档来自技高网
...

【技术保护点】
1.一种敏感数据统计方法,其特征在于,包括:/n对接收到的原始数据进行源数据匹配,得到对应的注册信息;其中,注册信息是根据源数据类别对原始源数据进行注册得到的;/n根据所述注册信息对应的脱敏策略对所述原始数据进行脱敏处理,得到脱敏数据,并存储至业务库;其中,所述脱敏策略是对注册信息进行策略配置得到的执行策略;/n根据与脱敏数据匹配的注册信息对所述业务库中的脱敏数据进行识别并统计,得到统计结果。/n

【技术特征摘要】
1.一种敏感数据统计方法,其特征在于,包括:
对接收到的原始数据进行源数据匹配,得到对应的注册信息;其中,注册信息是根据源数据类别对原始源数据进行注册得到的;
根据所述注册信息对应的脱敏策略对所述原始数据进行脱敏处理,得到脱敏数据,并存储至业务库;其中,所述脱敏策略是对注册信息进行策略配置得到的执行策略;
根据与脱敏数据匹配的注册信息对所述业务库中的脱敏数据进行识别并统计,得到统计结果。


2.根据权利要求1所述的敏感数据统计方法,其特征在于,根据与脱敏数据匹配的注册信息对所述业务库中的脱敏数据进行识别并统计,得到统计结果,包括:
根据预设标识字符提取所述业务库中多个脱敏数据的脱敏字符串;
对每个所述脱敏字符串的第一元素进行匹配,得到对应的注册信息;
对注册信息中敏感数据类型相同的脱敏字符串的第二元素进行统计,得到该敏感数据类型对应的数据统计结果。


3.根据权利要求2所述的敏感数据统计方法,其特征在于,对注册信息中敏感数据类型相同的脱敏字符串的第二元素进行统计,得到该敏感数据类型对应的数据统计结果,包括:
将注册信息中敏感数据类型相同的脱敏字符串的第二元素添加至集合中;
对所述集合进行去重处理,得到去重集合;
将所述去重集合的元素总数作为该敏感数据类型对应的数据统计结果。


4.根据权利要求1所述的敏感数据统计方法,其特征在于,对接收到的原始数据进行源数据匹配,得到对应的注册信息,包括:
根据多个注册信息的源数据字段对所述原始数据进行匹配,确定所述对应的注册信息。


5.根据权利要求1所述的敏感数据统计方法,其特征在于,所述脱敏策略包括筛选条件、脱敏字段、脱敏模式以及脱敏方式。
<...

【专利技术属性】
技术研发人员:李国喜
申请(专利权)人:杭州数梦工场科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1