【技术实现步骤摘要】
一种敏感数据识别方法及系统
[0001]本专利技术涉及网络
,具体涉及一种敏感数据识别方法及系统
。
技术介绍
[0002]随着数字经济的快速发展,在业务生产的过程中产生了多种多样的数据,复杂多样的数据缺乏完善的安全保护措施,重要数据面临严峻的安全风险挑战
。
为了有效保障数据安全,需要针对不同类型的数据需要使用与之相对应的安全保护措施,尤其是面向用户和企业的高价值数据,应该通过使用安全的防护措施以保障核心高价值数据的安全性
。
如何识别数据中存在的高价值敏感数据已成为数据安全领域的重要课题之一,成为越来越多的数据安全人员的研究方向
。
现有的敏感数据识别技术方案主要是通过正则通用匹配的方式识别数据中的敏感数据
。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0004]现有的敏感数据识别技术方案中,由于只是根据字符特征进行匹配,因此该类技术方案存在误报率高的问题,进而导致工作效率低下,已经无法满足互联网 ...
【技术保护点】
【技术特征摘要】
1.
一种敏感数据识别方法,其特征在于,包括:根据待识别的敏感数据的类型,确定出针对所述待识别的敏感数据的匹配规则
、
以及所述待识别的敏感数据的关联特征;从待检测数据中选取出与所述匹配规则相匹配的数据,作为疑似敏感数据;在所述疑似敏感数据的上下文内容中,确认存在与所述关联特征相匹配的数据的情况下,计算与所述关联特征相匹配的数据的关联特征匹配度值;在所述关联特征匹配度值超过设定匹配度阈值的情况下,确认所述疑似敏感数据为敏感数据
。2.
如权利要求1所述的敏感数据识别方法,其特征在于,所述计算与所述关联特征相匹配的数据的关联特征匹配度值,具体包括:在确定出的所述关联特征为一个的情况下,为与所述关联特征相匹配的数据指定一个大于所述匹配度阈值的数值,作为所述关联特征匹配度值
。3.
如权利要求2所述的敏感数据识别方法,其特征在于,所述计算与所述关联特征相匹配的数据的关联特征匹配度值,具体包括:在确定出的所述关联特征为多个的情况下,根据每一个关联特征的预设权重,为与每一个关联特征相匹配的数据赋予得分值;累积与所有关联特征相匹配的数据的总得分值,作为所述关联特征匹配度值
。4.
如权利要求1所述的敏感数据识别方法,其特征在于,所述待识别的敏感数据的类型包括以下至少之一:个人基本资料
、
个人身份信息
、
个人生物识别信息
、
网络身份信息
、
个人财产信息
、
个人通讯方式
。5.
如权利要求1所述的敏感数据识别方法,其特征在于,所述确定出针对所述待识别的敏感数据的匹配规则,具体包括:根据所述待识别的敏感数据的长度
、
字符和数据特征,确定出与所述待识别的敏感数据相对应的匹配规则
。6.
一种敏感数据识别系统,其特征在于,包括:匹配规则和...
【专利技术属性】
技术研发人员:张天顺,邱春武,康宇,
申请(专利权)人:新浪技术中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。