当前位置: 首页 > 专利查询>王楠专利>正文

一种基于场景分析的敏感数据脱敏和识别的方法技术

技术编号:33132948 阅读:45 留言:0更新日期:2022-04-17 00:53
本发明专利技术提供了一种基于场景分析的敏感数据脱敏和识别的方法。获取待处理数过所述目标模型对所述待处理数据进行敏感识别;其中,所述敏感识别用于在所述待处理数据为敏感数据时,将所述待处理数据进行场景编码,通过场景编码进行替代脱敏。有益效果为:本发明专利技术的敏感数据识别的方式是基于场景识别的方式,他的应用范围更加的广阔,适合对任何的敏感数据进行识别和脱敏。脱敏方面本发明专利技术是场景编码,这种方式首先,因为是场景编码,所以能够很明确的确定具体的场景信息,能够根据场景信息或者专属的场景标记,确定每一份隐私数据是什么类型的隐私数据,在哪里产生,便于对隐私数据进行溯源管理。溯源管理。溯源管理。

【技术实现步骤摘要】
一种基于场景分析的敏感数据脱敏和识别的方法


[0001]本专利技术涉及敏感
,特别涉及一种基于场景分析的敏感数据脱敏和识别的方法。

技术介绍

[0002]目前,随着互联网的迅速发展,数据安全问题引发了全民的广泛关注,个人信息及敏感信息泄露的安全事件,可能引发严重的网络犯罪。而传统敏感数据发现技术对于不规范敏感数据的识别率特别低,容易出现遗漏导致敏感数据泄露风险。
[0003]在传统的敏感数据发现技术中,对敏感数据进行识别和定位是基于正则表达式匹配、关键字码表映射、数据类型定义判别、数据特征计算等技术手段。
[0004]对于传统技术手段,能准确发现敏感数据的前提是数据质量比较高的情况,由于存在某些企业的数据采集流程不规范导致数据质量比较差的情况,例如客户地址字段中存在一些特殊字符、缺失省市区等关键识别信息、非地址数据等。
[0005]传统技术对于敏感数据的识别主要是对于数据流中敏感数据识别,但是对于一些客户端程序,这些敏感数据就是无法进行识别,对于这些客户端,敏感数据就是客户的身份信息和加密的密码账号等等,对于这些数据,常规的方式需要关键字识别的方式,但是,是很难判断是不是敏感数据,所以这时候需要场景的带入,才能判断是不是敏感数据,例如,在加密的场景中,或者其他身份验证的场景,在这些场景中,传统的方式,因为本来就存在加密手段,一般不会认定为加密的方式,所以存在极大的技术疏漏。

技术实现思路

[0006]本专利技术提供一种基于场景分析的敏感数据脱敏和识别的方法,用以解决传统技术对于敏感数据的识别主要是对于数据流中敏感数据识别,但是对于一些客户端程序,这些敏感数据就是无法进行识别,对于这些客户端,敏感数据就是客户的身份信息和加密的密码账号等等,对于这些数据,常规的方式需要关键字识别的方式,但是,是很难判断是不是敏感数据,所以这时候需要场景的带入,才能判断是不是敏感数据,例如,在加密的场景中,或者其他身份验证的场景,在这些场景中,传统的方式,因为本来就存在加密手段,一般不会认定为加密的方式,所以存在极大的技术疏漏的情况。
[0007]一种基于场景分析的敏感数据识别和脱敏的方法,包括:
[0008]获取待处理数据;其中,
[0009]所述待处理数据包括进程信息;
[0010]根据所述进程信息,确定所述待处理数据的适用场景;
[0011]根据所述适用场景,构建目标模型,并通过所述目标模型对所述待处理数据进行敏感识别;其中,
[0012]所述敏感识别用于确定所述待处理数据中的敏感数据,并进行场景编码,通过场景编码进行替代脱敏。
[0013]在本专利技术的一种实施例中:所述方法还包括:
[0014]建立场景数据库;其中,
[0015]所述场景数据库内包括:数据源信息、数据进程信息、数据类型信息和数据行为信息;
[0016]所述数据源信息包括:数据载体和数据存储路径;
[0017]所述数据进程信息包括:进程类型和进程功能;
[0018]所述数据类型信息包括:文本、音频、图像、视频和图表;
[0019]所以数据行为信息包括:行为环境和行为目标;
[0020]根据所述场景数据库,建立数据场景模型;
[0021]根据所述数据场景模型和所述适用场景,确定数据场景类型和场景组成框架;
[0022]根据所述数据场景类型,构建场景框架;
[0023]根据所述场景组成框架,在所述场景数据库中提取场景信息
[0024]根据所述场景信息和场景框架,搭建所述目标模型。
[0025]在本专利技术的一种实施例中:所述方法还包括:
[0026]根据所述进程数据,确定产生所述待处理数据的进程节点;
[0027]根据所述进程节点,确定所述待处理数据的执行流程和节点特征;
[0028]根据所述执行流程,获取所述待处理数据的行为框架;
[0029]根据所述节点特征,对所述待处理数据进行预处理;其中,
[0030]所述预处理包括:特征提取、重叠识别和行为判定;
[0031]将所述预处理的处理结果与所述行为框架进行融合,确定所述待处理数据的适用场景。
[0032]在本专利技术的一种实施例中:所述方法还包括:
[0033]根据所述待处理数据的执行流程,确定所述待处理数据的行为轨迹;
[0034]根据所述行为轨迹,进行功能标定;
[0035]根据所述功能标定,确定所述待处理数据的产生顺序;
[0036]根据所述产生顺序,生成所述待处理数据的轨迹地图;
[0037]根据所述轨迹地图,标定所述待处理数据的执行流程。
[0038]在本专利技术的一种实施例中:所述方法还包括:
[0039]根据所述待处理数据,确定所述待处理数据在所述适用场景中每个进程节点的节点行为;
[0040]根据所述节点行为,确定节点特征;其中,
[0041]所述节点特征包括:行为特征和数据特征;
[0042]将所述节点特征带入所述目标模型进行识别对比,判断所述节点行为产生的数据是否为敏感数据;
[0043]当所述节点产生的数据为敏感数据时,将所述待识别数据进行敏感性标记;其中,
[0044]所述敏感性标记包括:场景标记、数据标记和行为标记。
[0045]在本专利技术的一种实施例中:所述方法还包括:
[0046]设置特征编码器;其中,
[0047]所述特征编码器包括:行为编码器、类型编码器、场景编码器;
[0048]根据所述编码器,对所述待处理数据进行场景分析,获取分析结果;
[0049]根据所分析结果,按照所述编码器的类型,对所述待处理数据进行编码,获取特征编码;
[0050]将所述特征编码进行多描述替代编码,构成场景编码;其中,
[0051]所述多描述替代编码包括:
[0052]构建标量量化器,对所述特征编码进行标量量化,获取第一熵编码;
[0053]构建网格量化器,对所述特征编码进行离散变换,并进行相关变换,生成二熵编码;
[0054]构建格型矢量量化器,对所述特征编码进行矢量量化,获取标准编码;
[0055]对比所述第一熵编码和第二熵编码,确定是否为相同熵编码;
[0056]当为相同熵编码时,将所述第一熵编码和标准编码作为场景编码。
[0057]在本专利技术的一种实施例中:所述方法还包括:
[0058]根据所述目标模型,设置在不同场景中敏感数据类型的识别协议;
[0059]其中,所述识别协议用于响应敏感性标记;
[0060]根据所述识别协议,在敏感识别时,获取敏感性标记;
[0061]根据所述敏感性标记,匹配对应的特征编码器。
[0062]在本专利技术的一种实施例中:所述方法还包括:
[0063]建立混合云服务器;其中,
[0064]所述混合云有多个公有云和一个私有云组成;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于场景分析的敏感数据识别和脱敏的方法,其特征在于,包括:获取待处理数据;其中,所述待处理数据包括进程信息;根据所述进程信息,确定所述待处理数据的适用场景;根据所述适用场景,构建目标模型,并通过所述目标模型对所述待处理数据进行敏感识别;其中,所述敏感识别用于确定所述待处理数据中的敏感数据,并进行场景编码,通过场景编码进行替代脱敏。2.如权利要求1所述的一种基于场景分析的敏感数据脱敏和识别的方法,其特征在于,所述方法还包括:建立场景数据库;其中,所述场景数据库内包括:数据源信息、数据进程信息、数据类型信息和数据行为信息;所述数据源信息包括:数据载体和数据存储路径;所述数据进程信息包括:进程类型和进程功能;所述数据类型信息包括:文本、音频、图像、视频和图表;所以数据行为信息包括:行为环境和行为目标;根据所述场景数据库,建立数据场景模型;根据所述数据场景模型和所述适用场景,确定数据场景类型和场景组成框架;根据所述数据场景类型,构建场景框架;根据所述场景组成框架,在所述场景数据库中提取场景信息根据所述场景信息和场景框架,搭建所述目标模型。3.如权利要求1所述的一种基于场景分析的敏感数据脱敏和识别的方法,其特征在于,所述方法还包括:根据所述进程数据,确定产生所述待处理数据的进程节点;根据所述进程节点,确定所述待处理数据的执行流程和节点特征;根据所述执行流程,获取所述待处理数据的行为框架;根据所述节点特征,对所述待处理数据进行预处理;其中,所述预处理包括:特征提取、重叠识别和行为判定;将所述预处理的处理结果与所述行为框架进行融合,确定所述待处理数据的适用场景。4.如权利要求3所述的一种基于场景分析的敏感数据脱敏和识别的方法,其特征在于,所述方法还包括:根据所述待处理数据的执行流程,确定所述待处理数据的行为轨迹;根据所述行为轨迹,进行功能标定;根据所述功能标定,确定所述待处理数据的产生顺序;根据所述产生顺序,生成所述待处理数据的轨迹地图;根据所述轨迹地图,标定所述待处理数据的执行流程。5.如权利要求1所述的一种基于场景分析的敏感数据脱敏和识别的方法,其特征在于,所述方法还包括:
根据所述待处理数据,确定所述待处理数据在所述适用场景中每个进程节点的节点行为;根据所述节点行为,确定节点特征;其中,所述节点特征包括:行为特征和数据特征;将所述节点特征带入所述目标模型进行识别对比,判断所述节点行为产生的数据是否为敏感数据;当所述节点产生的数据为敏感数据时,将所述待识别数据进行敏感性标记;其中,所述敏感性标记包括:场景标记、数据标记和行为标记。6.如...

【专利技术属性】
技术研发人员:王楠
申请(专利权)人:王楠
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1