一种基于数据分类分级的数据安全管控方法及系统技术方案

技术编号:15392029 阅读:59 留言:0更新日期:2017-05-19 05:04
本发明专利技术公开了一种基于数据分类分级的数据安全管控方法及系统,该方法包括以下步骤:发现,将管理范围内的数据集合向量化;分类,将发现并向量化后的文档,根据分类模型进行分类;识别重要业务数据,将分类结果根据重要业务数据识别模型,判定所述文档是否是重要业务数据;分级,将识别出的所述重要业务数据根据分级模型,定义所述文档的安全级别;标识,记录分级后所述重要业务数据中的文档重要特征,在所述文档头中记录标识ID和所述文档重要特征,被标识数据的详细内容存储在第三方数据库;对经过所述重要业务数据感知步骤形成的重要业务数据进行分析管控。通过该发明专利技术的方案,从安全管理和数据管理相结合视角出发构建数据安全管控体系,客观、准确的评估体系,采用指数评估方式,量化安全管控结果,指导管控改进。

Data security management and control method and system based on data classification and classification

The invention discloses a system and data security control method based on data classification, the method comprises the following steps: find the management within the scope of the collection of data to quantify; and to quantify classification, will find the document, are classified according to the classification model; identification of important business data, the classification results based on important business data recognition model, determine whether the document is an important business data; classification, identified the important business data according to the hierarchical model, the definition of the security level of the document; mark, record the important features in classification of the important business data in the document, record the important features of ID and the identification document in the the document head, identified by the data stored in the database with the content of third party; for an important business after the formation of the important steps of the perception of business data Data analysis and control. Through the invention, from the safety management and data management combined with the perspective of constructing data security control system, objective and accurate evaluation system, the evaluation index, the quantitative safety control results, guidance control improvement.

【技术实现步骤摘要】
一种基于数据分类分级的数据安全管控方法及系统
本专利技术涉及数据安全领域,具体涉及一种数据安全管控方法及系统。
技术介绍
DLP,数据泄密防护技术,是通过一定的技术手段,防止企业的指定数据或信息资产以违反安全策略规定的形式流出企业的一种策略和技术。DLP技术可以对数据存储、使用和传输过程进行处理,对数据内容进行识别和处理,确保数据可以透明处理,智能加密,具有较高的稳定性和系统兼容性,并可以形成详尽的数据内容级别的审计日志。DLP的核心技术点包括传输协议分析、数据格式内容识别、高速规则匹配、自然语义分析、机器学习、聚类分析、数据特征匹配等。现阶段的DLP,一般采用了三种基础检测技术和三种高级检测技术。基础检测技术中通常有三种方式,正则表达式检测(标示符)、关键字和关键字对检测、文档属性检测。基础检测方法采用常规的检测技术进行内容搜索和匹配,比较常见的都是正则表达式和关键字,这两种方法可以对明确的敏感信息内容进行检测。文档属性检测主要是针对文档的类型、文档的大小、文档的名称进行检测,其中文档的类型的检测是基于文件格式进行检测,不是简单的基于后缀名检测,对于修改后缀名的场景,文件类型检测可以准确的检测出被检测文件的类型,目前支持100多种标准的文件类型,并且可以通过自定义特征,去识别特殊的文件类型格式的文档。高级检测技术中也有三种方式,精确数据比对(EDM)、指纹文档比对(IDM)、向量分类比对(SVM)。EDM用于保护通常为结构化格式的数据,例如客户或员工数据库记录。IDM和SVM用于保护非结构化的数据,例如MicrosoftWord或PowerPoint文档。对于EDM、IDM、SVM而言,敏感数据会先由企业标识出来,然后再由DLP判别其特征,以进行精准的持续检测。判别特征的流程包括DLP访问和检索文本及数据、予以正规化,并使用不可逆的打乱方式进行保护。DLP检测是以实际的机密内容为基础,而非根据文件本身。因此,DLP不只能检测敏感数据的检索项或衍生项,而且能够标识文件格式与特征信息格式不同的敏感数据。例如,如果已经判别出机密MicrosoftWord文档的特征,DLP就能够在相同的内容以PDF附件的方式通过电子邮件进行提交时,将其准确检测出来。现有技术存在以下缺点:不具备定义文档的安全等级的能力;不具备发现重要文档分布情况的能力;不具备在文档内部,标识文档特征属性的能力;不具备文档使用限制控制能力;不具备文档使用异常行为发现的能力;不具备数据安全指数化表示的能力;不具备数据安全评估的能力。
技术实现思路
为解决上述技术问题,本专利技术提供了一种基于数据分类分级的数据安全管控方法,包括以下步骤:1).重要业务数据感知步骤,其包括:1.1).发现,将管理范围内的数据集合向量化;1.2).分类,将发现并向量化后的文档,根据分类模型进行分类;1.3).识别重要业务数据,将分类结果根据重要业务数据识别模型,判定所述文档是否是重要业务数据;1.4).分级,将识别出的所述重要业务数据根据分级模型,定义所述文档的安全级别;1.5).标识,记录分级后所述重要业务数据中的文档重要特征,在文档头中记录标识ID和所述文档重要特征,被标识数据的详细内容存储在第三方数据库;对经过所述重要业务数据感知步骤形成的重要业务数据进行分析管控,包括:对所述重要业务数据进行访问权限控制;对所述重要业务数据进行加密存储;采用行为建模与异常行为发现进行数据动态安全分析;根据分析结果,对所述重要业务数据赋予不同的行为权限;通过隔离方式,确保所述重要业务数据安全;追踪所述重要业务数据外部使用情况。优选的,采用定性和定量结合的方式量化评估数据安全管控效果。优选的,所述步骤1.1)具体包括:根据管理要求和分析管控的反馈,将管理范围内的数据集合向量化,向量化后形成重要业务数据分布热力图,通过颜色的深浅程度来区别重要数据的分布情况。优选的,所述步骤1.2)具体包括:通过初始训练样本,形成数据分类模型,之后通过样本数据进一步训练所述数据分类模型,形成数据分类模型,对重要业务数据进行分类,对于有异议的分类结果,人工参与辅助判断。优选的,所述步骤1.3)具体包括:按照识别标准可以直接识别的重要业务数据直接标识为重要业务数据,对于无法直接识别的数据采用重要数据重点阈模型进行判定。优选的,所述步骤1.4)具体包括:根据分级模型,将所述重要业务数据划分为高、中、低、无四种级别。优选的,所述步骤1.5)具体包括:记录分级后所述重要业务数据中的文档重要特征,在所述文档头中记录所述标识ID和文档重要特征,被标识数据的详细内容存储在第三方数据库,与被分类、分级后的文档,通过所述标识ID与数据库中所述详细内容进行关联,所述被标识数据的详细内容包括:所述标识ID、操作者、操作时间、所在操作系统、安全等级、被赋予的权限六部分内容。优选的,采用行为建模与异常行为发现进行数据动态安全分析包括:通过建立用户行为模型,依靠数据挖掘和机器学习算法,实现用户行为分析和异常行为的自主监测;在样本容量很小时,采用聚类分析方法,对单一类型的行为数据先采用Canopy算法进行粗聚类,得到数据集聚合的类别数量,然后采用K-Means聚类方法进行更高精度的聚类。优选的,所述通过隔离方式,确保所述重要业务数据安全,包括:使用云存储技术,将所述重要业务数据存储在云端,而非存储在客户端,通过隔离方式,确保所述重要业务数据安全。为解决上述技术问题,本专利技术提供了一种基于数据分类分级的数据安全管控系统,包括重要业务数据感知装置和重要业务数据分析管控装置;其中,所述重要业务数据感知装置,包括:发现模块,将管理范围内的数据集合向量化;分类模块,将发现并向量化后的文档,根据分类模型进行分类;重要业务数据识别模块,将分类结果根据重要业务数据识别模型,判定所述文档是否是重要业务数据;分级模块,将识别出的所述重要业务数据根据分级模型,定义所述文档的安全级别;标识模块,记录分级后所述重要业务数据中的文档重要特征,在所述文档头中记录标识ID和所述文档重要特征,被标识数据的详细内容存储在第三方数据库;所述重要业务数据分析管控装置对所述重要业务数据感知装置形成的重要业务数据进行分析管控,包括:访问权限模块,对所述重要业务数据进行访问权限控制;数据加密模块,对所述重要业务数据进行加密存储;综合分析模块,采用行为建模与异常行为发现进行数据动态安全分析;管控策略模块,根据分析结果,对所述重要业务数据赋予不同的行为权限;隔离模块,通过隔离方式,确保所述重要业务数据安全;外部使用安全管控模块,追踪所述重要业务数据外部使用情况。通过本专利技术的技术方案取得了以下技术效果:以数据价值为核心,从安全管理和数据管理相结合视角出发构建数据安全管控体系。创新的技术引用,将云存储技术、数据分析技术(分类、标识、识别重点数据)、行为建模与行为分析技术引入安全领域。全面的分析管控体系,采用机器学习相关算法、大数据精神,分析安全、管控安全。客观、准确的评估体系,采用指数评估方式,量化安全管控结果,指导管控改进。附图说明图1是本专利技术安全管控体系框架图图2是本专利技术感知体系框架图图3是本专利技术分类流程图图4是本专利技术分级处理流程图图5是本专利技术数据分级模型图图6是本专利技术分级流程图本文档来自技高网
...
一种基于数据分类分级的数据安全管控方法及系统

【技术保护点】
一种基于数据分类分级的数据安全管控方法,包括以下步骤:1).重要业务数据感知步骤,其包括:1.1).发现,将管理范围内的数据集合向量化;1.2).分类,将发现并向量化后的文档,根据分类模型进行分类;1.3).识别重要业务数据,将分类结果根据重要业务数据识别模型,判定所述文档是否是重要业务数据;1.4).分级,将识别出的所述重要业务数据根据分级模型,定义所述文档的安全级别;1.5).标识,记录分级后所述重要业务数据中的文档重要特征,在文档头中记录标识ID和所述文档重要特征,被标识数据的详细内容存储在第三方数据库;对经过所述重要业务数据感知步骤形成的重要业务数据进行分析管控,包括:对所述重要业务数据进行访问权限控制;对所述重要业务数据进行加密存储;采用行为建模与异常行为发现进行数据动态安全分析;根据分析结果,对所述重要业务数据赋予不同的行为权限;通过隔离方式,确保所述重要业务数据安全;追踪所述重要业务数据外部使用情况。

【技术特征摘要】
1.一种基于数据分类分级的数据安全管控方法,包括以下步骤:1).重要业务数据感知步骤,其包括:1.1).发现,将管理范围内的数据集合向量化;1.2).分类,将发现并向量化后的文档,根据分类模型进行分类;1.3).识别重要业务数据,将分类结果根据重要业务数据识别模型,判定所述文档是否是重要业务数据;1.4).分级,将识别出的所述重要业务数据根据分级模型,定义所述文档的安全级别;1.5).标识,记录分级后所述重要业务数据中的文档重要特征,在文档头中记录标识ID和所述文档重要特征,被标识数据的详细内容存储在第三方数据库;对经过所述重要业务数据感知步骤形成的重要业务数据进行分析管控,包括:对所述重要业务数据进行访问权限控制;对所述重要业务数据进行加密存储;采用行为建模与异常行为发现进行数据动态安全分析;根据分析结果,对所述重要业务数据赋予不同的行为权限;通过隔离方式,确保所述重要业务数据安全;追踪所述重要业务数据外部使用情况。2.根据权利要求1所述的方法,采用定性和定量结合的方式量化评估数据安全管控效果。3.根据权利要求1所述的方法,所述步骤1.1)具体包括:根据管理要求和分析管控的反馈,将管理范围内的数据集合向量化,向量化后形成重要业务数据分布热力图,通过颜色的深浅程度来区别重要数据的分布情况。4.根据权利要求1所述的方法,所述步骤1.2)具体包括:通过初始训练样本,形成数据分类模型,之后通过样本数据进一步训练所述数据分类模型,形成数据分类模型,对重要业务数据进行分类,对于有异议的分类结果,人工参与辅助判断。5.根据权利要求1所述的方法,所述步骤1.3)具体包括:按照识别标准可以直接识别的重要业务数据,直接标识为重要业务数据,对于无法直接识别的数据,采用重要数据重点阈模型进行判定。6.根据权利要求1所述的方法,所述步骤1.4)具体包括:根据分级模型,将所述重要业务数据划分为高、中、低、无四种级别。7.根据权利要求1所述的方法,所述步骤1.5)具体包括:记录分级后所述重要业务数据中的文档重要特征,在所述文档头中...

【专利技术属性】
技术研发人员:孙亚东王志海魏力何晋昊喻波杨巨杰
申请(专利权)人:北京明朝万达科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1