一种数据识别方法及装置制造方法及图纸

技术编号:33633368 阅读:58 留言:0更新日期:2022-06-02 01:41
本申请提供了一种数据识别方法及装置,涉及数据处理技术领域。该方法为:获取数据表;对所述数据表进行字段识别,若所述数据表包括设定字段时,则确定所述数据表中所述设定字段对应的数据为敏感数据;针对所述数据表中除所述设定字段之外的字段对应的第一待识别数据,则利用基于数据内容的识别规则对所述第一待识别数据进行识别处理,以识别出所述第一待识别数据中是否存在敏感数据。由此,提升了敏感数据识别的速度和准确度。据识别的速度和准确度。据识别的速度和准确度。

【技术实现步骤摘要】
一种数据识别方法及装置


[0001]本申请涉及数据处理
,尤其涉及一种数据识别方法及装置。

技术介绍

[0002]数据的安全是数据应用的重要挑战之一,随着系统用户的增加、权限滥用导致数据泄漏风险不断增加,目前很多安全产品主要用于应对来自外部的威胁,缺少对来自内部威胁的有效识别和防范。数据作为最核心的资产,由于包含大量的个人信息,如手机号、身份证号、银行卡号、地址等及其重要又敏感的信息,因此需要数据安全服务以更好的保护数据。
[0003]为了保护敏感数据,首先需要识别敏感数据。而数据识别一般是基于数据识别规则,针对系统中存在的表进行敏感字段的自动发现。识别过程是根据设定的规则对目标表进行匹配的过程,需要对数据库中的内容按条匹配,记录识别结果。也就是说,数据识别是一个特别消耗资源的操作,因此如何进行高效识别是当前行业遇到的普遍问题。
[0004]目前提供的敏感数据识别方案中,是利用基于内容的识别规则对数据库中的全库内容也即全部数据进行匹配,这样就会导致识别效率低甚至匹配结果误差大的问题。
[0005]因此,如何提升敏感本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据识别方法,其特征在于,包括:获取数据表;对所述数据表进行字段识别,若所述数据表包括设定字段时,则确定所述数据表中所述设定字段对应的数据为敏感数据;针对所述数据表中除所述设定字段之外的字段对应的第一待识别数据,则利用基于数据内容的识别规则对所述第一待识别数据进行识别处理,以识别出所述第一待识别数据中是否存在敏感数据。2.根据权利要求1所述的方法,其特征在于,若所述数据表不包括所述设定字段,则从所述数据表中提取出第一设定数据量的第二待识别数据,所述第一设定数据量小于所述数据表中数据的总数据量;利用基于数据内容的识别规则对所述第二待识别数据进行识别处理;当识别出所述第二待识别数据存在敏感数据,则确认所述数据表是否存在敏感数据。3.根据权利要求1所述的方法,其特征在于,利用基于数据内容的识别规则对所述第一待识别数据进行识别处理,以识别出所述第一待识别数据是否存在敏感数据,包括:从所述第一待识别数据中提取第二设定数据量的第三待识别数据,所述第二设定数据量小于所述第一待识别数据的总数据量;利用基于数据内容的识别规则对所述第三待识别数据进行识别处理;当识别所述第三待识别数据存在敏感数据时,则确定所述第一待识别数据存在敏感数据;当识别出所述第三待识别数据不存在敏感数据时,则确定所述第一待识别数据不存在敏感数据。4.根据权利要求3所述的方法,其特征在于,所述第一待识别数据为所述数据表中除所述设定字段之外的每个字段对应的数据,则所述第三待识别数据为该字段对应的第一待识别数据中提取出的;利用基于数据内容的识别规则对所述第三待识别数据进行识别处理,包括:利用该字段对应的基于数据内容的识别规则对每条第三识别数据进行匹配;分别记录匹配成功的第一数据量和匹配失败的第二数据量;当匹配成功的第一数据量不小于第一设定数据量阈值时,则确认该字段对应的第三待识别数据存在敏感数据;当匹配失败的第二数据量大于第二设定数据量阈值时,则确认该字段对应的第三识别数据不存在敏感数据;其中,所述第一设定数据量阈值与所述第二设定数据量阈值的和值为所述第二设定数据量。5.根据权利要求2所述的方法,其特征在于,所述第二待识别数据为所述数据表中每个字段对应的数据;利用基于数据内容的识别规则对所述第二待识别数据进行识别处理,包括:利用该字段对应的基于数据内容的识别规则与每条第二待识别数据进行匹配;分别记录匹配成功的第三数据量和匹配失败的第四数据量;当所述第三数据量不小于第三设定数据量阈值时,则确认该字段对应的第二待识别数
据存在敏感数据;当所述第四数据量大于第四设定数据量阈值时,则确认该字段对应的第二待识别数据不存在敏感数据;其中,所述第三设定数据量阈值与所述第四设定数据量阈值的和值为所述第一设定数据量。6.根据权利要求5所述的方法,其特征在于,当确认各个字段对应的第二待识别数据均不存在敏感数据时,则确认所述数据表不存在敏感数据。7.一种数据识别装置,其特征在...

【专利技术属性】
技术研发人员:王晨龙
申请(专利权)人:新华三大数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1