服务器、员工泄露企业信息的预测方法及存储介质技术

技术编号:21432900 阅读:36 留言:0更新日期:2019-06-22 12:07
本发明专利技术涉及一种服务器、员工泄露企业信息的预测方法及存储介质,该方法包括:以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行梳理得到指标数据;获取样本数据集;建立预测模型,将样本数据集输入至预测模型进行训练;获取预测模型输出的指标数据及权重,若有预测模型的指标数据属于预定的非业务可解释性指标数据,且该指标数据的权重与其他指标数据的权重的相对差值大于阈值,则丢弃该预测模型;获取剩余的预测模型的面积AUC,以该面积AUC最大的预测模型作为员工泄露企业信息的预测模型;利用该预测模型对嫌疑员工进行预测。本发明专利技术能够对员工泄露企业信息的概率进行预测,增加了防范手段,降低信息泄露的风险。

【技术实现步骤摘要】
服务器、员工泄露企业信息的预测方法及存储介质
本专利技术涉及数据挖掘
,尤其涉及一种服务器、员工泄露企业信息的预测方法及存储介质。
技术介绍
目前,对员工泄露企业信息的防范已经成为企业信息安全的重要工作。对员工信息泄露的防范手段主要是从泄露手段上进行杜绝,如禁止外发电子邮件、禁止USB拷贝、禁止使用聊天工具进行文件传输等。但是信息泄露的手段层出不穷,例如,员工在获取机密或敏感信息以后,直接拍照得到机密或敏感信息。因此,从信息泄露的手段上进行防范仍然不能解决员工泄露企业信息的问题,企业信息安全得不到有效的保障。
技术实现思路
本专利技术的目的在于提供一种服务器、员工泄露企业信息的预测方法及存储介质,旨在对员工泄露企业信息的概率进行预测,增加了防范手段,降低信息泄露的风险。为实现上述目的,本专利技术提供一种服务器,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行逐级梳理,得到各个主因子的指标数据;从企业的历史数据中获取已核实的本文档来自技高网...

【技术保护点】
1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行逐级梳理,得到各个主因子的指标数据;从企业的历史数据中获取已核实的泄露企业信息的员工的指标数据并为该员工标识对应的第一标签,以及获取未泄露企业信息的员工的指标数据并为该员工标识对应的第二标签,以每一员工对应的指标数据为样本数据,已核实的泄露企业信息的员工的指标数据及未泄露企业信息的员工的指标数据构成样本数据集;利用预定的预测算法分别建立对应的各预测模型,将样本...

【技术特征摘要】
1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行逐级梳理,得到各个主因子的指标数据;从企业的历史数据中获取已核实的泄露企业信息的员工的指标数据并为该员工标识对应的第一标签,以及获取未泄露企业信息的员工的指标数据并为该员工标识对应的第二标签,以每一员工对应的指标数据为样本数据,已核实的泄露企业信息的员工的指标数据及未泄露企业信息的员工的指标数据构成样本数据集;利用预定的预测算法分别建立对应的各预测模型,将样本数据集中每一员工对应的样本数据输入至各预测模型,以对各预测模型进行训练;获取各预测模型输出的指标数据及该指标数据对应的权重,若有预测模型的指标数据属于预定的非业务可解释性指标数据,且该指标数据对应的权重与除该指标数据外的其他指标数据的权重的相对差值大于预定的阈值,则丢弃该预测模型;对于未丢弃的各预测模型,获取各预测模型的受试者工作特征曲线,并计算各预测模型的受试者工作特征曲线下对应的面积AUC,以该面积AUC最大的预测模型作为员工泄露企业信息的预测模型;获取嫌疑员工的指标数据,将该指标数据输入至该员工泄露企业信息的预测模型中,获取输出的指标数据的权重,将输出的指标数据的权重相加得到该嫌疑员工泄露企业信息的概率值。2.根据权利要求1所述的服务器,其特征在于,所述以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行逐级梳理,得到各个主因子的指标数据的步骤,具体包括:以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进行数据梳理,得到各主因子对应的各从因子,对各从因子进行数据梳理得到各次因子,对各次因子进行数据梳理得到各分因子,对各分因子进行数据梳理得到各分因子的指标数据。3.根据权利要求2所述的服务器,其特征在于,所述处理系统被所述处理器执行时,还实现如下步骤:根据各主因子、各从因子、各次因子、各分因子及指标数据建立树形结构,将每一分因子对应的指标数据的权重相加得到该分因子的权重,将每一次因子对应的分因子的权重相加得到该次因子的权重,将每一从因子对应的次因子的权重相加得到该从因子的权重,将每一主因子对应的从因子的权重相加得到该主因子的权重,以供展示该树形结构及该树形结构中各主因子的权重、各从因子的权重、各次因子的权重、各分因子的权重及指标数据的权重。4.根据权利要求1至3任一项所述的服务器,其特征在于,所述获取各预测模型的受试者工作特征曲线,并计算各预测模型的受试者工作特征曲线下对应的面积AUC的步骤,具体包括:获取预测模型对应的真阴率TN、假阳率FP、假阴率FN及真阳率TP;根据所述真阴率TN、假阳率FP计算假阳率:FPR=FP/(TN+FP);根据所述假阴率FN、真阳率TP计算真阳率:TPR=TP/(TP+FN);以假阳率FPR为横坐标,以真阳率TPR为纵坐标绘制该预测模型的受试者工作特征曲线,并计算该预测模型的受试者工作特征曲线下的面积AUC。5.一种员工泄露企业信息的预测方法,其特征在于,所述员工泄露企业信息的预测方法包括:S1,以员工操作信息、员工个人信息、员工办公信息和员工习惯信息为主因子进...

【专利技术属性】
技术研发人员:王正胡晶轩薛志强马刚
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1