一种用于标记敏感数据的方法、设备、介质及程序产品技术

技术编号:36537804 阅读:22 留言:0更新日期:2023-02-01 16:27
本申请的目的是提供一种用于标记敏感数据的方法、设备、介质及程序产品,该方法包括:对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。本申请可以通过预设的分类分级规则对数据库的日志数据进行智能分类分级,并自动打上对应的敏感标记,且可以灵活选择所使用的分类分级规则,从而实现智能流程化的形式。从而实现智能流程化的形式。从而实现智能流程化的形式。

【技术实现步骤摘要】
一种用于标记敏感数据的方法、设备、介质及程序产品


[0001]本申请涉及通信领域,尤其涉及一种用于标记敏感数据的技术。

技术介绍

[0002]敏感数据是指泄漏后可能会给社会或个人带来严重危害的数据。包括个人隐私数据,如姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等。在现有技术中,业界对敏感数据的解决方案是手动标记形式,并未有智能流程化的形式。

技术实现思路

[0003]本申请的一个目的是提供一种用于标记敏感数据的方法、设备、介质及程序产品。
[0004]根据本申请的一个方面,提供了一种用于标记敏感数据的方法,该方法包括:
[0005]对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;
[0006]根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;
[0007]根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。
[0008]根据本申请的一个方面,提供了一种用于标记敏感数据的计算机设备,该设备包括:
[0009]一一模块,用于对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;
[0010]一二模块,用于根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;
[0011]一三模块,用于根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。
[0012]根据本申请的一个方面,提供了一种用于标记敏感数据的计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,其中,所述处理器执行所述计算机程序以实现如上所述任一方法的操作。
[0013]根据本申请的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如上所述任一方法的操作。
[0014]根据本申请的一个方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所述任一方法的步骤。
[0015]与现有技术相比,本申请通过对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记
Gate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)、嵌入式设备等。所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。优选地,所述设备还可以是运行于所述终端、网络设备、或终端与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的程序。
[0027]当然,本领域技术人员应能理解上述设备仅为举例,其他现有的或今后可能出现的设备如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
[0028]在本申请的描述中,“多个”的含义是两个或者更多,除非另有明确具体的限定。
[0029]图1示出根据本申请一个实施例的一种用于标记敏感数据的方法流程图,该方法包括步骤S11、步骤S12和步骤S13。在步骤S11中,计算机设备对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;在步骤S12中,计算机设备根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;在步骤S13中,计算机设备根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。
[0030]在步骤S11中,计算机设备对数据库的日志数据进行抽样采集,获得一个或多个抽样数据。在一些实施例中,日志数据是指数据库的操作行为日志数据,日志数据中包括但不限于针对数据库的某个操作行为的行为时间、行为内容(例如,在数据库中读取、插入、修改、删除的存储数据)、行为结果(例如,是否成功)、行为对象(即数据库中的至少一个存储数据)等。在一些实施例中,可以按照预定的采样率来对数据库的日志数据进行抽样采集,采样方式可以是按照行为时间的先后顺序来进行间隔采样,例如,若采样率为10%,则在该数据库中的每10次已发生的操作行为中采集1次操作行为的日志数据,即若已采集操作行为1的日志数据,则下一次采集的是按照行为时间的先后顺序在该操作行为1之后第十次发生的操作行为2的日志数据。在一些实施例中,采样方式还可以是无顺序随机采样,例如,先采集针对该数据库的所有操作行为的多个日志数据,若采样率为10%,则根据该多个日志数据的数量Num,在该多个日志数据中随机抽取Num*10%数量的日志数据作为抽样数据。
[0031]在步骤S12中,计算机设备根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息。在一些实施例中,分类分级规则中包括多个预定的敏感分类(例如,个人身份信息类、个人财产信息类)及每个敏感分类的识别策略,识别策略用于识别数据中是否包括该敏感分类所对应的敏感分类,具体的识别方式包括但不限于正则表达式识别、关键词识别、模型特征识别等,该分类分级规则还包括分级策略,分级策略用于在若识别到数据中包括该识别策略所对应的敏感分类的时候确定该数据在该敏感分类下对应的敏感级别,敏感级别可以是用数值形式来表征,例如,数值越大,则说明对应的数据越敏感或越不安全,或者,敏感级别还可以用文本形式来表征,例如,“轻度敏感”、“中度敏感”、“重度敏感”等,若根据分类分级规则识别到数据中包括某个识别策略所对应的敏感分类,则将其作为该数据对应的敏感分类,然后继续根据分类分级规则确定该数据在该敏感分类下对应的敏感级别。在一些实施
例中,可以是一个敏感分类仅对应一个敏感级别,若识别到数据中包括某个分类策略所对应的敏感分类,则直接将该敏感分类对应的敏感级别作为该数据在该敏感分类下对应的敏感级别,或者,还可以是一个敏感分类对应多个不同的敏感级别,则此时需要根据分级策略来确定该数据在该敏感分类下对应的敏感级别,具体的确定方式包括但不限于语义分析方式、关键词提取方式,模型特征方式等,例如,通过语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于标记敏感数据的方法,其中,该方法包括:对数据库的日志数据进行抽样采集,获得一个或多个抽样数据;根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息;根据所述敏感级别信息,针对至少一个抽样数据打上敏感标记,并存储所述至少一个抽样数据,其中,所述敏感标记包括所述每个抽样数据对应的敏感分类及敏感级别信息。2.根据权利要求1所述的方法,其中,所述对数据库的日志数据进行抽样采集,获得一个或多个抽样数据,包括:通过已部署在数据库上的插件对所述数据库的日志数据进行抽样采集,获得一个或多个抽样数据。3.根据权利要求1所述的方法,其中,所述方法还包括:确定所述数据库对应的分类分级规则。4.根据权利要求3所述的方法,其中,所述确定所述数据库对应的分类分级规则,包括:获得用户在多个默认分类分级规则中选择的所述数据库对应的分类分级规则。5.根据权利要求3所述的方法,其中,所述确定所述数据库对应的分类分级规则,包括:通过对所述数据库中的存储数据进行语义分析,确定所述数据库对应的存储数据特征;根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则。6.根据权利要求5所述的方法,其中,所述根据所述存储数据特征,确定与所述存储数据特征相匹配的分类分级规则,包括:根据所述存储数据特征,确定所述数据库对应的涉及敏感场景信息;根据所述涉及敏感场景信息,确定与所述涉及敏感信息相匹配的分类分级规则。7.根据权利要求1所述的方法,其中,所述分类分级规则包括分类策略和敏感级别策略;其中,所述根据分类分级规则对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类,获取所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述分类策略对所述抽样数据进行识别,确定所述抽样数据对应的敏感分类;根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息。8.根据权利要求7所述的方法,其中,所述敏感级别策略包括所述分类策略下的每个敏感分类对应的第一敏感级别信息;其中,所述根据所述敏感级别策略,确定所述抽样数据在所述敏感分类下对应的敏感级别信息,包括:根据所述敏感级别策略,获得所述敏感分类对应的第一敏感级别信息;根据所述第一敏感级别信息,确定所述抽样数据在所述敏...

【专利技术属性】
技术研发人员:刘金利伍贤锋周平陈缘张艳
申请(专利权)人:公安部第三研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1