一种基于文件的敏感规则创建方法及电子设备技术

技术编号:39900480 阅读:4 留言:0更新日期:2023-12-30 13:14
本发明专利技术实施例公开了一种基于文件的敏感规则创建方法及电子设备

【技术实现步骤摘要】
一种基于文件的敏感规则创建方法及电子设备


[0001]本专利技术涉及计算机
,具体涉及一种基于文件的敏感规则创建方法及电子设备


技术介绍

[0002]目前,敏感规则的划分可以从文件属性和文件内容两方面来实现

但是,目前的敏感规则划分存在如下缺陷:
[0003](1)
敏感规则的配置和使用不够灵活:现有的
DLP(Data Leakage Prevention
,数据防泄漏
)
技术是针对已知的常规场景设立敏感条件,但是遇到新的场景则需要重新设立新的敏感条件来解决

[0004](2)
多规则检查速度慢:现有
DLP
技术在复杂场景中配置多个规则检查敏感文件,而在复杂的规则关系中,往往存在一个规则多次检查的情况,导致检查速度慢

[0005](3)
关键字规则检查速度慢:现有
DLP
技术在配置的关键字数量较多时,检查速度缓慢


技术实现思路

[0006]针对
技术介绍
中所提及的技术缺陷,本专利技术实施例的目的在于提供一种基于文件的敏感规则创建方法及电子设备

[0007]为实现上述目的,第一方面,本专利技术实施例提供了一种基于文件的敏感规则创建方法,包括单个敏感规则创建,单个敏感规则包括文件属性类规则和文件内容类规则;
[0008]其中,文件属性类规则的创建过程具体为:
[0009]获取文件属性,并从所述文件属性中提取出与敏感相关的多个信息,将每一个信息划分为单个敏感规则;
[0010]文件内容类规则的创建过程具体为:
[0011]获取文件内容,并从所述文件内容中提取出与敏感相关的多个信息,将每一个信息划分为单个敏感规则

[0012]作为本申请的一种优选实现方式,所述创建方法还包括组合敏感规则创建,具体为:
[0013]根据单个敏感规则和运算符得到组合敏感规则;所述运算符包括与

或和非

[0014]进一步地,作为本申请的一种优选实现方式,所述创建方法还包括规则树构建,具体为:
[0015]基于二叉树原理,将任一组合敏感规则确定为起始节点,每一中间节点存放运算符,每一叶子节点存放任一组合敏感规则;且同一组合敏感规则可存放于不同的叶子节点

[0016]第二方面,本专利技术实施例提供了一种电子设备,其用于基于文件创建敏感规则

该电子设备包括创建模块,用于:
[0017]创建单个敏感规则;所述单个敏感规则包括文件属性类规则和文件内容类规则;
[0018]其中,文件属性类规则的创建过程具体为:
[0019]获取文件属性,并从所述文件属性中提取出与敏感相关的多个信息,将每一个信息划分为单个敏感规则;
[0020]文件内容类规则的创建过程具体为:
[0021]获取文件内容,并从所述文件内容中提取出与敏感相关的多个信息,将每一个信息划分为单个敏感规则

[0022]其中,所述文件内容类规则包括有规律的文本内容规则和无规律的文本内容规则,所述有规律的文本内容规则包括姓名规则

银行卡规则

身份证规则

电话号码规则

快递单号规则

邮箱地址规则

源代码规则

关键字规则和正则规则;所述无规律的文本内容规则包括
DNA
规则和聚类规则

[0023]作为一种具体实现方式,当将单个敏感规则应用于庞大的关键字数量检查时,所述关键字规则中采用
BM
多模匹配算法提升检查速度

[0024]进一步地,所述创建模块还用于创建组合敏感规则,具体为:
[0025]根据单个敏感规则和运算符得到组合敏感规则;所述运算符包括与

或和非

[0026]进一步地,所述电子设备还包括构建模块,用于构建规则树,具体为:
[0027]基于二叉树原理,将任一组合敏感规则确定为起始节点,每一中间节点存放运算符,每一叶子节点存放任一组合敏感规则;且同一组合敏感规则可存放于不同的叶子节点

[0028]第三方面,本专利技术实施例还提供了另一种电子设备,包括处理器

输入设备

输出设备和存储器,所述处理器

输入设备

输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如上述第一方面所述的方法步骤

[0029]本专利技术实施例提供的敏感规则创建方法,具有如下优点:
[0030]1、
基于文件属性或文件内容,针对每一个敏感相关的信息划分单个敏感规则,管理员只需要根据自己的场景组合这些敏感规则使用,即可达到敏感文件识别的目的

这样大大提高了规则的配置灵活性,方便管理员对应更多敏感文件识别场景

[0031]2、
针对多规则检查敏感文件的应用场景,基于二叉树原理,构建规则树来维护维护之间的关系,可有效地避免复杂规则关系中有重复的规则检查,从而提高了多规则的检查速度

[0032]3、
针对采用关键字规则检查敏感文件的应用场景,采用
BM
多模匹配算法实现,从而提升了检查速度

附图说明
[0033]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍

[0034]图1是本专利技术实施例提供的基于文件的敏感规则创建方法流程图;
[0035]图2是文件属性类规则的示意图;
[0036]图3是文件内容类规则的示意图;
[0037]图4是场景一中组合规则的创建示意图;
[0038]图5是场景二中组合规则的创建示意图;
[0039]图6是规则树原理图;
[0040]图7是电子设备的一种结构图;
[0041]图8是电子设备的另一种结构图

具体实施方式
[0042]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0043]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征

整体
、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于文件的敏感规则创建方法,其特征在于,包括单个敏感规则创建,单个敏感规则包括文件属性类规则和文件内容类规则;其中,文件属性类规则的创建过程具体为:获取文件属性,并从所述文件属性中提取出与敏感相关的多个信息,将每一个信息划分为单个敏感规则;文件内容类规则的创建过程具体为:获取文件内容,并从所述文件内容中提取出与敏感相关的多个信息,将每一个信息划分为单个敏感规则
。2.
如权利要求1所述的创建方法,其特征在于,所述文件类属性规则包括文件类型规则

文件加密规则

文件
MD5
规则

文件名称规则

文件大小规则

文件日期规则和文件容量规则
。3.
如权利要求1所述的创建方法,其特征在于,所述文件内容类规则包括有规律的文本内容规则和无规律的文本内容规则,所述有规律的文本内容规则包括姓名规则

银行卡规则

身份证规则

电话号码规则

快递单号规则

邮箱地址规则

源代码规则

关键字规则和正则规则;所述无规律的文本内容规则包括
DNA
规则和聚类规则
。4.
如权利要求3所述的创建方法,其特征在于,当将单个敏感规则应用于庞大的关键字数量检查时,所述关键字规则中采用
BM
多模匹配算法提升检查速度
。5.
如权利要求1所述的创建方法,其特征在于,所述创建方法还包括组合敏感规则创建,具体为:根据单个敏感规则和运算符得到组合敏感规则;所述运算符包括与

【专利技术属性】
技术研发人员:梁俊林张礼达何华荣黄杰王志祝青柳
申请(专利权)人:深圳市联软科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1