一种邮件网络中恶意社区的确定方法及系统技术方案

技术编号:21899169 阅读:35 留言:0更新日期:2019-08-17 18:31
本发明专利技术实施例提供一种邮件网络中恶意社区的确定方法及系统。其中,方法包括:基于SimRank算法,确定邮件网络中的缺失邮件集合;基于所述缺失邮件集合和所述邮件网络中的已知邮件集合,确定所述邮件网络中的恶意社区。本发明专利技术实施例提供的一种邮件网络中恶意社区的确定方法及系统,通过SimRank算法确定邮件网络中的缺失邮件集合来解决现有技术中的数据缺失问题,使得判定过程能够基于完整的数据集,从而提高判定结果的准确性,充分保障和维护信息安全。

A Method and System for Determining Malicious Community in Mail Network

【技术实现步骤摘要】
一种邮件网络中恶意社区的确定方法及系统
本专利技术实施例涉及信息安全
,尤其涉及一种邮件网络中恶意社区的确定方法及系统。
技术介绍
电子邮件由于其易用性和可携带信息的多维性,已成为现代社会不可缺少的通信方式之一,人们通过网络发送电子邮件,使交流变得更加容易、便捷。但近年来,电子邮件已成为敏感信息的主要传播途径,同时也成为泄密的主要途径,从而造成了严重的信息安全问题。现有技术中,通常使用如下方法解决该信息安全问题:S1,取证及网络构建:从目标主机中获取其存储的所有邮件,以构建邮件网络;S2,根据该邮件网络中敏感邮件在所有邮件中的占比,判定该邮件网络是否为恶意网络,以根据判定结果采取相应的技术手段保障和维护信息安全。但现有技术也存在一定缺陷:仅根据目标主机中存储的所有邮件判定邮件网络是否为恶意网络,而没有考虑到在取证之前由于目标主机的硬件损毁或泄密者的反取证能力造成的数据缺失问题,从而造成判定结果不准确,不能够充分保障和维护信息安全。
技术实现思路
针对现有技术中存在的技术问题,本专利技术实施例提供一种邮件网络中恶意社区的确定方法及系统。第一方面,本专利技术实施例提供一种邮件网络中恶意社区的确定方法,包括:基于SimRank算法,确定邮件网络中的缺失邮件集合;基于所述缺失邮件集合和所述邮件网络中的已知邮件集合,确定所述邮件网络中的恶意社区。第二方面,本专利技术实施例提供一种邮件网络中恶意社区的确定系统,包括:缺失邮件集合确定模块,用于基于SimRank算法,确定邮件网络中的缺失邮件集合;恶意社区确定模块,用于基于所述缺失邮件集合和所述邮件网络中的已知邮件集合,确定所述邮件网络中的恶意社区。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。本专利技术实施例提供的一种邮件网络中恶意社区的确定方法及系统,通过SimRank算法确定邮件网络中的缺失邮件集合来解决现有技术中的数据缺失问题,使得判定过程能够基于完整的数据集,从而提高判定结果的准确性,充分保障和维护信息安全。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种邮件网络中恶意社区的确定方法流程图;图2为本专利技术实施例提供的一种有向图的结构示意图;图3为本专利技术实施例提供的一种邮件网络中恶意社区的确定系统的结构示意图;图4为本专利技术实施例提供的一种电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的一种邮件网络中恶意社区的确定方法流程图,如图1所示,该方法包括:步骤101,基于SimRank算法,确定邮件网络中的缺失邮件集合。具体地,邮件网络为基于目标主机中存储的所有邮件所构建的网络,其中,目标主机可以为邮件服务器或个人电脑主机,需要说明的是,邮件服务器是一种用来负责电子邮件收发管理的设备,个人电脑主机是计算机除去输入输出设备以外的主要机体部分。现有技术中通过判定该网络是否为恶意网络进而来保障和维护信息安全,但由于目标主机的硬件损毁或泄密者的反取证能力造成的数据缺失问题,造成判定结果不准确,从而不能够充分保障和维护信息安全。其中,需要说明的是,恶意网络指的是在计算机系统上执行恶意任务的网络,在本专利技术实施例中特指传播敏感信息的邮件网络。对此,本专利技术实施例基于SimRank算法,确定邮件网络中的缺失邮件集合。其中,缺失邮件集合包括若干封缺失邮件,需要说明的是,每一封缺失邮件均为目标主机中存储的所有邮件之外的邮件,是由于目标主机的硬件损毁或泄密者的反取证能力造成的已缺失的邮件。本领域技术人员可以理解的是,通过确定邮件网络中的缺失邮件集合来解决现有技术中的数据缺失问题,使得判定过程能够基于完整的数据集,从而提高判定结果的准确性,充分保障和维护信息安全。以下对SimRank算法进行简要说明:SimRank是一种基于图的拓扑结构信息来衡量任意两个对象间相似程度的模型,该模型由MIT实验室的GlenJeh和JenniferWidom教授在2002年首先提出。SimRank相似度的核心思想为:如果两个对象和被其相似的对象所引用(即它们有相似的入邻边结构),那么这两个对象也相似。近年来已在信息检索领域引起广泛关注,成功应用于网页排名、协同过滤、孤立点检测、网络图聚类、近似查询处理等。在本专利技术实施例中,通过SimRank算法,可确定邮件网络中的缺失邮件集合。步骤102,基于所述缺失邮件集合和所述邮件网络中的已知邮件集合,确定所述邮件网络中的恶意社区。需要说明的是,已知邮件集合指的是目标主机中存储的所有邮件所组成的集合,其包括若干封邮件。通过已知邮件集合和步骤101中确定的缺失邮件集合,能够判定邮件网络是否为恶意网络。进一步地,由于邮件网络通常范围较大,为了实现精准定位恶意区域所在,本专利技术实施例将邮件网络划分为若干个社区,进而通过已知邮件集合和缺失邮件集合,确定每一社区是否为恶意社区。最终,对所有恶意社区采取相应的技术手段进行处理,以保障和维护信息安全。本专利技术实施例提供的方法,通过SimRank算法确定邮件网络中的缺失邮件集合来解决现有技术中的数据缺失问题,使得判定过程能够基于完整的数据集,从而提高判定结果的准确性,充分保障和维护信息安全。在上述实施例的基础上,本专利技术实施例对构建邮件网络的过程进行进一步说明,即,所述基于SimRank算法,确定邮件网络中的缺失邮件集合,之前还包括:步骤1001,获取目标主机中存储的所有邮件,组成所述已知邮件集合。具体地,该步骤为邮件获取过程,可以理解的是,目标主机可以为邮件服务器或个人电脑主机,上述实施例中已对邮件服务器和个人电脑主机进行了说明,此处不再赘述。通常,目标主机中存储有若干封邮件,在本专利技术实施例中,获取这若干封邮件组成已知邮件集合。其中,若目标主机为个人电脑主机,则获取该主机中安装的Outlook、Foxmail等邮件客户端中存储的所有离线邮件,将这所有的离线邮件组成已知邮件集合。步骤1002,基于所述已知邮件集合,构建有向图G=(V,E)并作为所述邮件网络;其中,V={v1,...,vi,...,vn}为节点集合,vi代表第i个邮件地址,E={<v1,vi>,...,<vi,vj>,...,<vj,vn>}为有向边集合,<vi,vj>代表vi发送邮件至vj。需要说明的是,该步骤为邮件网络构建过程,具体为:本文档来自技高网...

【技术保护点】
1.一种邮件网络中恶意社区的确定方法,其特征在于,包括:基于SimRank算法,确定邮件网络中的缺失邮件集合;基于所述缺失邮件集合和所述邮件网络中的已知邮件集合,确定所述邮件网络中的恶意社区。

【技术特征摘要】
1.一种邮件网络中恶意社区的确定方法,其特征在于,包括:基于SimRank算法,确定邮件网络中的缺失邮件集合;基于所述缺失邮件集合和所述邮件网络中的已知邮件集合,确定所述邮件网络中的恶意社区。2.根据权利要求1所述的方法,其特征在于,所述基于SimRank算法,确定邮件网络中的缺失邮件集合,之前还包括:获取目标主机中存储的所有邮件,组成所述已知邮件集合;基于所述已知邮件集合,构建有向图G=(V,E)并作为所述邮件网络;其中,V={v1,...,vi,...,vn}为节点集合,vi代表第i个邮件地址,E={<v1,vi>,...,<vi,vj>,...,<vj,vn>}为有向边集合,<vi,vj>代表vi发送邮件至vj。3.根据权利要求2所述的方法,其特征在于,所述基于SimRank算法,确定邮件网络中的缺失邮件集合,包括:对于所述邮件网络中不存在有向边的任意两个节点,根据以下公式判定所述任意两个节点间存在缺失邮件的概率R(vi,vj):其中,c为常系数且0<c<1,|S(vi)|为vi发出的敏感邮件的数量,|S(vj)|为vj发出的敏感邮件的数量,N(vi)为vi的临域,N(vj)为vj的临域,p为N(vi)中的任一节点,q为N(vj)中的任一节点,R(p,q)为p、q间存在已知邮件的概率,|N(vi)|为vi发出和收到的所有邮件的数量,|N(vj)|为vj发出和收到的所有邮件的数量;若所述概率大于第一预设阈值,则判定所述任意两个节点间存在缺失邮件;将所述邮件网络中的所有缺失邮件,组成所述缺失邮件集合。4.根据权利要求3所述的方法,其特征在于,所述基于所述缺失邮件集合和所述邮件网络中的已知邮件集合,确定所述邮件网络中的恶意社区,包括:基于所述缺失邮件集合,对所述邮件网络进行更新,生成更新后的邮件网络;基于社区发现算法,将所述更新后的邮件网络划分为多个社区;对于每一社区,计算所述社区中敏感邮件的占比,若所述占比大于第二预设阈值,则...

【专利技术属性】
技术研发人员:喻民姜建国杨群领刘超刘明奇黄伟庆
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1