System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,特别是涉及一种邮件外发行为的检测方法、一种邮件外发行为的检测装置、一种电子设备和一种计算机可读存储介质。
技术介绍
1、目前,邮件已成为各个企业的一种常用的沟通交流方式,在工作中发挥着重要的作用,而邮件也成为各个企业机密信息泄露的重要途径,现有技术中为了防止企业机密信息以邮件的形式外发泄露,通过限制邮件外发次数、邮件大小、人工审核等方式,而该方式大大限制了邮件的使用习惯,也不利于信息的快速沟通,还会造成大量的人力和财力的消耗。
技术实现思路
1、鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种邮件外发行为的检测方法、一种邮件外发行为的检测装置、一种电子设备和一种计算机可读存储介质。
2、第一方面,本专利技术实施例公开了一种邮件外发行为的检测方法,所述方法包括:
3、获取预设主题库、预设行为中心以及预设行为基线;
4、获取用户当前邮件外发行为的行为数据;
5、根据所述预设主题库,构建与所述行为数据对应的第一离散特征和第一连续特征;
6、根据所述第一离散特征和所述第一连续特征,获取所述行为数据离所述预设行为中心的距离;
7、根据所述距离与所述预设行为基线,判断所述当前邮件外发行为是否正常。
8、可选地,所述获取预设主题库、预设行为中心以及预设行为基线之前,还包括:
9、获取用户的历史外发邮件的数据集;
10、统计所
11、获取所述数据集中的第二连续特征,以及所述第二连续特征的取值范围,并将所述取值范围分为预设数量个数的取值区间段;
12、统计各个所述取值区间段的频数;
13、根据所述频数和所述数据集,得到与所述第二连续特征对应的第二频率信息;
14、根据所述第一频率信息和所述第二频率信息,构建预设主题库;
15、根据所述第二离散特征和所述第二连续特征,得到预设行为基线和预设行为中心。
16、可选地,所述根据所述频数和所述数据集,得到与所述第二连续特征对应的第二频率信息,包括:
17、将所述取值区间段的频数进行正态分布转化,得到正态化参数;
18、由中间向两侧从所述数据集中获取预设比例的数据并设为正常数据,剩下数据设为异常数据;
19、根据所述正常数据、所述异常数据以及所述正态化参数,构建特征行为主题库;
20、对所述特征行为主题库中的数据信息进行转化,得到与所述第二连续特征对应的第二频率信息。
21、可选地,所述根据所述第二离散特征和所述第二连续特征,得到预设行为基线和预设行为中心,包括:
22、将所述第二离散特征和所述第二连续特征进行拼接,得到用户邮件外发特征的数据集;
23、使用单类学习算法,对所述用户邮件外发特征的数据集进行分析,得到正常行为簇;
24、利用聚类算法,得到与所述正常行为簇对应的行为中心;
25、确定所述正常行为簇离所述第一行为中心的最远距离,并将所述最远距离设定为预设行为基线,将所述行为中心设定为预设行为中心。
26、可选地,所述根据所述距离与所述预先训练的行为基线,判断所述当前邮件外发行为是否正常,包括:
27、若所述距离大于预先训练的行为基线,则确定所述当前邮件外发行为为异常;
28、若所述距离小于或等于所述预先训练的行为基线,则确定所述当前邮件外发行为为正常。
29、可选地,所述根据所述距离与所述预先训练的行为基线,判断所述当前邮件外发行为是否正常之后,还包括:
30、若所述当前邮件外发行为为异常,则将所述异常进行输出,并拦截所述当前邮件外发行为;
31、若所述当前邮件外发行为为正常,则正常执行所述当前邮件外发行为。
32、可选地,所述由中间向两侧从所述数据集中获取预设比例的数据并设为正常数据,剩下数据设为异常数据,包括:
33、依据三西格玛原则,由中间向两侧从所述数据集中获取预设比例的数据并设为正常数据,剩下数据设为异常数据。
34、第二方面,本专利技术实施例公开了一种邮件外发行为的检测装置,所述装置包括:
35、第一获取模块,用于获取预设主题库、预设行为中心以及预设行为基线;
36、第二获取模块,用于获取用户当前邮件外发行为的行为数据;
37、第一构建模块,用于根据所述预设主题库,构建与所述行为数据对应的第一离散特征和第一连续特征;
38、第三获取模块,用于根据所述第一离散特征和所述第一连续特征,获取所述行为数据离所述预设行为中心的距离;
39、判断模块,用于根据所述距离与所述预设行为基线,判断所述当前邮件外发行为是否正常。
40、可选地,所述装置还包括:
41、第四获取模块,用于获取用户的历史外发邮件的数据集;
42、第一统计模块,用于统计所述数据集中的第二离散特征,以及与所述第二离散特征对应的第一频率信息;
43、第五获取模块,用于获取所述数据集中的第二连续特征,以及所述第二连续特征的取值范围,并将所述取值范围分为预设数量个数的取值区间段;
44、第二统计模块,用于统计各个所述取值区间段的频数;
45、第一得到模块,用于根据所述频数和所述数据集,得到与所述第二连续特征对应的第二频率信息;
46、第二构建模块,用于根据所述第一频率信息和所述第二频率信息,构建预设主题库;
47、第二得到模块,用于根据所述第二离散特征和所述第二连续特征,得到预设行为基线和预设行为中心。
48、可选地,第一得到模块包括:
49、第一转化子模块,用于将所述取值区间段的频数进行正态分布转化,得到正态化参数;
50、设置子模块,用于由中间向两侧从所述数据集中获取预设比例的数据并设为正常数据,剩下数据设为异常数据;
51、构建子模块,用于根据所述正常数据、所述异常数据以及所述正态化参数,构建特征行为主题库;
52、第二转化子模块,用于对所述特征行为主题库中的数据信息进行转化,得到与所述第二连续特征对应的第二频率信息。
53、可选地,第二得到模块包括:
54、拼接子模块,用于将所述第二离散特征和所述第二连续特征进行拼接,得到用户邮件外发特征的数据集;
55、分析子模块,用于使用单类学习算法,对所述用户邮件外发特征的数据集进行分析,得到正常行为簇;
56、得到子模块,用于利用聚类算法,得到与所述正常行为簇对应的行为中心;
57、确定子模块,用于确定所述正常行为簇离所述第一行为中心的最远距离,并将所述最远距离设定为预设行为基线,将所述行为中本文档来自技高网...
【技术保护点】
1.一种邮件外发行为的检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述邮件外发行为的检测方法,其特征在于,所述获取预设主题库、预设行为中心以及预设行为基线之前,还包括:
3.根据权利要求2所述邮件外发行为的检测方法,其特征在于,所述根据所述频数和所述数据集,得到与所述第二连续特征对应的第二频率信息,包括:
4.根据权利要求2所述邮件外发行为的检测方法,其特征在于,所述根据所述第二离散特征和所述第二连续特征,得到预设行为基线和预设行为中心,包括:
5.根据权利要求1所述邮件外发行为的检测方法,其特征在于,所述根据所述距离与所述预先训练的行为基线,判断所述当前邮件外发行为是否正常,包括:
6.根据权利要求5所述邮件外发行为的检测方法,其特征在于,所述根据所述距离与所述预先训练的行为基线,判断所述当前邮件外发行为是否正常之后,还包括:
7.根据权利要求3所述邮件外发行为的检测方法,其特征在于,所述由中间向两侧从所述数据集中获取预设比例的数据并设为正常数据,剩下数据设为异常数据,包括:
8.一
9.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的邮件外发行为的检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的邮件外发行为的检测方法的步骤。
...【技术特征摘要】
1.一种邮件外发行为的检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述邮件外发行为的检测方法,其特征在于,所述获取预设主题库、预设行为中心以及预设行为基线之前,还包括:
3.根据权利要求2所述邮件外发行为的检测方法,其特征在于,所述根据所述频数和所述数据集,得到与所述第二连续特征对应的第二频率信息,包括:
4.根据权利要求2所述邮件外发行为的检测方法,其特征在于,所述根据所述第二离散特征和所述第二连续特征,得到预设行为基线和预设行为中心,包括:
5.根据权利要求1所述邮件外发行为的检测方法,其特征在于,所述根据所述距离与所述预先训练的行为基线,判断所述当前邮件外发行为是否正常,包括:
6.根据权利要求5所述邮件外发行为的检测方法,其特征在于,所述...
【专利技术属性】
技术研发人员:刘继通,罗鹏,肖扬文,王志海,喻波,
申请(专利权)人:北京明朝万达科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。