一种数据防泄漏系统的任务审批方法和系统技术方案

技术编号:19934266 阅读:37 留言:0更新日期:2018-12-29 04:34
本发明专利技术提供了一种数据防泄漏系统的任务审批方法和系统。本发明专利技术针对特定类型的文档进行审批,能够提升文档审核的效率以及针对性;并通过对文档进行属于必驳回条目的数字关键字的扫描,一方面可以提升审核效率;另一方面,能够避免必驳回关键字的权重被其他非驳回关键字的权重稀释的问题,从而提升审批准确率,避免携带必驳回关键字的文档被审批通过的情况,提升审核准确率;另外,本发明专利技术预先设置敏感关键词以及对应的主观权重和客观权重,使得文档的审批结果更接近人工审核结果。

【技术实现步骤摘要】
一种数据防泄漏系统的任务审批方法和系统
本专利技术涉及数据安全领域,特别是涉及一种数据防泄漏系统的任务审批方法和系统。
技术介绍
目前,对于数据防泄漏系统(DLP,Dataleakageprevention)中的任务审批流程主要是基于工作流或者模板规则。其中,对于基于工作流的任务审批流程,在审批流程中全部按照预先定义的工作流执行,例如,在申请人提出任务审批申请(即申请人申请对某个文档进行何种操作)后,第一层审批人员收到审批请求,人工检视申请人所提出申请的文本内容,然后,执行“同意”或者“拒绝”的动作;如果“同意”,则继续按照预先定义的工作流将经过第一层同意的任务审批申请发送至下一层审批人员进行进一步审批处理。但是,这种审批方案必须要由人工查看文档进行干预鉴定,只有在人工确定文档内容符合审批规则之后才能后续的自动审批流程。为此,相关技术中提供了对审批文件自动审批的方法,具体包括:对审批文件进行分词扫描,提取预先设置的敏感词;然后,根据每个敏感词预先配置的一个权值以及每个敏感词在审批文档中出现的次数,来计算审批文件的敏感信息的权重值;最后,根据不同权重值区间与不同审批结果之间的关系,来确本文档来自技高网...

【技术保护点】
1.一种数据防泄漏系统的任务审批方法,其特征在于,包括:获取任务审批请求中的文档内容;判断所述文档内容是否包括表示预设文档类型的预设关键词;若所述文档内容包括表示预设文档类型的预设关键词,则将所述文档内容与预设数字关键字进行匹配,确定所述文档内容是否包括预设数字关键字;若所述文档内容包括预设数字关键字,则响应于所述任务审批请求,返回表示审批驳回的审批结果;若所述文档内容不包括预设数字关键字,提取所述文档内容中的候选敏感关键词;根据预设的敏感关键词与主观权重以及客观权重的对应关系,确定所述候选敏感关键词中与所述敏感关键词匹配的目标敏感关键词,以及与所述目标敏感关键词对应的目标主观权重和目标客观权...

【技术特征摘要】
1.一种数据防泄漏系统的任务审批方法,其特征在于,包括:获取任务审批请求中的文档内容;判断所述文档内容是否包括表示预设文档类型的预设关键词;若所述文档内容包括表示预设文档类型的预设关键词,则将所述文档内容与预设数字关键字进行匹配,确定所述文档内容是否包括预设数字关键字;若所述文档内容包括预设数字关键字,则响应于所述任务审批请求,返回表示审批驳回的审批结果;若所述文档内容不包括预设数字关键字,提取所述文档内容中的候选敏感关键词;根据预设的敏感关键词与主观权重以及客观权重的对应关系,确定所述候选敏感关键词中与所述敏感关键词匹配的目标敏感关键词,以及与所述目标敏感关键词对应的目标主观权重和目标客观权重;确定所述目标敏感关键词在所述文档内容中出现的目标次数;根据所述目标敏感关键词的所述目标主观权重、所述目标客观权重以及所述目标次数,计算所述文档内容的目标敏感度;根据预设的敏感度区间与审批结果的对应关系,查找所述目标敏感度对应的目标敏感度区间,以及所述目标敏感度区间对应的目标审批结果;响应所述任务审批请求,返回所述目标审批结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标敏感关键词的所述目标主观权重、所述目标客观权重以及所述目标次数,计算所述文档内容的目标敏感度,包括:根据以下公式计算每个目标敏感关键词的组合权重;其中,wi表示第i个目标敏感关键词的组合权重,m表示所述文档内容中所述目标敏感关键词的总数,ai表示第i个目标敏感关键词的目标客观权重,bi表示第i个目标敏感关键词的目标主观权重,其中1≤i≤m;根据每个目标敏感关键词的组合权重和目标次数,计算所述文档内容的目标敏感度。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标敏感关键词的所述目标主观权重、所述目标客观权重以及所述目标次数,计算所述文档内容的目标敏感度之前,所述方法还包括:确定所述任务审批请求对应的目标审批人;根据预先设置的审批人与主观因子之间的对应关系,确定所述目标审批人对应的目标主观因子;相应的,所述根据所述目标敏感关键词的所述目标主观权重、所述目标客观权重以及所述目标次数,计算所述文档内容的目标敏感度,包括:根据以下公式计算每个目标敏感关键词的组合权重;wi=αai+(1-α)bi,(0≤α≤1);其中,wi表示第i个目标敏感关键词的组合权重,ai表示第i个目标敏感关键词的目标客观权重,bi表示第i个目标敏感关键词的目标主观权重,α为目标审批人的目标主观因子;根据每个目标敏感关键词的组合权重和目标次数,计算所述文档内容的目标敏感度。4.根据权利要求2或3所述的方法,其特征在于,所述根据每个目标敏感关键词的组合权重和目标次数,计算所述文档内容的目标敏感度之前,所述方法还包括:对每个目标敏感关键词的组合权重进行归一化处理,得到每个目标敏感关键词的归一化组合权重,其中,所有目标敏感关键词的归一化组合权重之和等于一;所述根据每个目标敏感关键词的组合权重和目标次数,计算所述文档内容的目标敏感度,包括:根据以下公式计算所述文档内容的目标敏感度W;W=N1*w′1+N2*w′2+…+Ni*w′i;其中,w′i表示第i个目标敏感关键词的归一化组合权重,Ni表示第i个目标敏感关键词的目标次数,其中1≤i≤m,m表示所述文档内容中所述目标敏感关键词的总数。5.根据权利要求1所述的方法,其特征在于,若所述目标审批结果为人工复核,所述响应所述任务审批请求,返回所述目标审批结果之后,所述方法还包括:接收人工复核结果;若所述人工复核结果为审批驳回,则将所述对应关系中所述目标敏感关键词的目标主观权重的数值提高预设第一比例阈值,并将所述候选敏感关键词中未与所述对应关系中的敏感关键词相匹配的目标候选关键词补充到所述对应关系中,并在所述对应关系中对所述目标候选关键词配置主观权重以及客...

【专利技术属性】
技术研发人员:曹建强王志华王志海喻波秦凯王玮
申请(专利权)人:北京明朝万达科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1