一种基于多标签超网络的云用户行为认定方法技术

技术编号:19694911 阅读:23 留言:0更新日期:2018-12-08 11:57
本发明专利技术涉及信息安全可信性技术领域,运用多标签超网络的云用户行为认定模型,实现了用户行为的细粒度划分,提高了异常检测的准确率。该方法将用户正常行为数据库训练成一个超网络,把当前的用户行为作为实例加入到超网络中进行分类。如果一次分类成功找到标签,则认定为正常用户。若没找到标签,则更新超网络权重,替换超边,再次进行标签寻找。若找到标签,则认定为风险型用户,反之则认定为恶意用户。仿真实验结果表明,该方案在分类精度上有明显提升。用于云用户行为的认定,实现了细粒度划分,提高了对用户行为的处理能力。

【技术实现步骤摘要】
一种基于多标签超网络的云用户行为认定方法
本专利技术属于信息安全可信性
,具体涉及一种基于多标签超网络的云用户行为认定方法。
技术介绍
近年来,信息技术飞速发展,世界经济迅速融为一体,人类已经进入了大数据时代,伴随着移动终端数量的急剧增长,移动云计算的广泛应用成为不可逆转的趋势,云计算从桌面市场转向移动市场是主要的发展方向,但也从中产生了各种各样的复杂问题,其中“用户—环境—服务”三个层面尤为突出,移动云服务以移动智能终端为信息接入口,通过移动互联网络实现各类综合服务,如何向用户提供绿色、可靠、稳定的终端服务则是移动云服务领域的核心与关键,从用户角度出发,如何在用户和云之间建立一个信任关系成为研究热点,如何在云服务进入实质性服务提供流程之前,对用户行为进行细粒度划分,成为亟待解决的问题。用户行为划分问题实际上就是分类问题,分类算法亦是模式识别,数据挖掘,异常检测等领域中一个重要的研究方向,一直受到国内外研究学者的重视,所谓分类,是根据数据集的特征构造一个对应的分类器,利用该分类器对未知类别的对象赋予类别的一种技术,目前,单标签分类问题已经取得了深入的研究,并且有很多成熟的相关算法,例如朴素贝叶斯分类算法(NaiveBayes,NB)、支持向量机(SupportVectorMachine,SVM)、k-邻近分类算法(K-NearestNeighbour,KNN)等,多标签分类算法则是利用了行为标签之间的依赖来提升分类器的性能,对于一些不太复杂且规模较小的关系数据,能够获得较好的分类精度,但节点的特征难以通过关联分类模型来学习获得,随着对分类算法研究的不断增多和深入,将分类算法与现实问题相结合,用于数据挖掘,兴趣推荐,异常检测等领域,越来越多的应用成果涌现。
技术实现思路
本专利技术的目的是提供一种基于多标签超网络的云用户行为认定方法,实现了用户行为的细粒度划分,提高了异常检测的准确率,该方法将用户正常行为数据库训练成一个超网络,把当前的用户行为作为实例加入到超网络中进行分类,如果一次分类成功找到标签,则认定为正常用户,若没找到标签,则更新超网络权重,替换超边,二次进行标签寻找,若找到标签,则认定为风险型用户,反之则认定为恶意用户。为了达到上述目的,本专利技术所采用的技术方案是:一种基于多标签超网络的云用户行为认定方法,该认定方法将用户的正常行为数据库训练成一个超网络模型,并把当前用户的实时行为作为实例加入到超网络模型中进行分类,如果一次分类成功找到标签,则认定为正常用户,若没找到标签,则更新超网络模型的超边权重,并替换超网络模型的超边,二次进行标签寻找,若找到标签,则认定为风险型用户,反之则认定为恶意用户。进一步的,将用户的正常行为数据库训练成一个超网络模型的过程包括以下步骤:步骤S1,对用户的正常行为数据库中的数据进行特征选择并获得训练数据实例x,将获得的训练数据实例x进行构造以形成训练集;步骤S2,对多标签超网络进行定义:H=(V,E,W),其中V表示对应于数据特征的顶点集合,E表示一组超边,W=[w1,w2,...,w|E|]T表示一个实数矩阵,其中每一行代表一个特定超边的权重向量,在多标签超网络中,每个超边ei由三部分组成:顶点集标签向量yi=[yi1,yi2,...,yic]和权重向量wi=[wi1,wi2,...,wic],vi和yi是从训练数据实例x生成的,wi是从训练数据中获得的参数;每个训练数据实例x通过超边和超边权重向量wi与标签yi相关联起来,以形成超网络模型。进一步的,所述步骤S1训练集的形成过程如下:步骤S11:定义Dis来对用户的正常行为数据库中的数据特征的重要性进行度量,以评估各个特征向量的辨别能力,其中,Dp是一个特征向量与它最邻近的不同类特征向量之间的平均距离,Dq是一个特征向量与它最远的同类特征向量之间的平均距离,用行为实例S作为训练集,计算Dp和Dq,计算公式如下:其中j≠k且class(Vj)≠class(Vk);其中j≠k且class(Vj)=class(Vk);dis(Vj,Vk)用于表示两个近似特征向量Vj和Vk之间距离的任何度量;步骤S12,采用Czekanowski距离来评估两个特征向量的不相似性,评估公式如下:其中,d代表特征维度,其值在[0,1]范围内有界,从而得出训练集,训练集大小为N,N={(x1,y1),...,(xi,yi),...,(xN,yN)},对于第i个样本,xi=[xi1,xi2,...,xiN]T∈RD是D维特征向量,yi=[yi1,yi2,...,yiC]T∈{1,0}C代表C维二进制标签向量,1代表相关,0代表无关,使用以下两个矩阵来描述训练集:X=[x1,...,xi,...,xN]T=[x(1),...,x(k),...,x(D)],Y=[y1,...,yi,...,yN]T=[y(1),...,y(l),...,y(C)],x(k)代表第k个特征向量,y(l)代表第l个二进制标签向量。进一步的,把当前用户的实时行为作为实例加入到超网络模型中进行分类的过程包括以下步骤:S1,把当前用户的实时行为作为实例加入到超网络模型中,输入实例x,计算属于数据实例的每个标签的概率,计算公式如下:其中,wji表示超边ej的权重向量的第i个权重值;然后对给定的输入实例x其类标签yi*通过计算每个类的条件概率,计算公式如下:其中,σj是标签j的阈值,σj的计算公式如下:yij表示第i个训练实例的标签j的真实值,yi*是阈值σ预测的标签j的值,若一次找到当前实例的标签,我们则认定此行为为正常用户行为,否则进行权重更新,替换超边,再次进行标签预测。进一步的,在超边替换过程中,对于每个超边ei,我们首先计算其适合度,然后从生成超边ei的相同训练实例中生成新的超边集合,并计算新的超边集合的适应度,如果新的超边的适应度大于超边ei的适应度,那么超边ei将被新的超边替代,并更新超边权重,适应度计算公式如下:其中,G是与超边ei匹配的训练实例集合;m是可能标签的数量,yij是实例(xi,yi)的标签j的值,y'j是超边ei的标签向量中的标签j的值。与现有技术相比,本专利技术的有益效果是:本专利技术实现了用户行为的细粒度划分,提高了异常检测的准确率,该方法将用户正常行为数据库训练成一个超网络,把当前的用户行为作为实例加入到超网络中进行分类,如果一次分类成功找到标签,则认定为正常用户,若没找到标签,则更新超网络权重,替换超边,再次进行标签寻找,若找到标签,则认定为风险型用户,反之则认定为恶意用户,仿真实验结果表明,该方案在分类精度上有明显提升,用于云用户行为的认定,实现了细粒度划分,提高了对用户行为的处理能力。附图说明图1是本专利技术的流程示意框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。一种基于多标签超网络的云用户行为认定方法,如图1所示,该认定方法将用户的正常行为数据库训练成一个超网络模型,并把当前本文档来自技高网
...

【技术保护点】
1.一种基于多标签超网络的云用户行为认定方法,其特征在于:该认定方法将用户的正常行为数据库训练成一个超网络模型,并把当前用户的实时行为作为实例加入到超网络模型中进行分类,如果一次分类成功找到标签,则认定为正常用户,若没找到标签,则更新超网络模型的超边权重,并替换超网络模型的超边,二次进行标签寻找,若找到标签,则认定为风险型用户,反之则认定为恶意用户。

【技术特征摘要】
1.一种基于多标签超网络的云用户行为认定方法,其特征在于:该认定方法将用户的正常行为数据库训练成一个超网络模型,并把当前用户的实时行为作为实例加入到超网络模型中进行分类,如果一次分类成功找到标签,则认定为正常用户,若没找到标签,则更新超网络模型的超边权重,并替换超网络模型的超边,二次进行标签寻找,若找到标签,则认定为风险型用户,反之则认定为恶意用户。2.根据权利要求1所述的一种基于多标签超网络的云用户行为认定方法,其特征在于:将用户的正常行为数据库训练成一个超网络模型的过程包括以下步骤:步骤S1,对用户的正常行为数据库中的数据进行特征选择并获得训练数据实例x,将获得的训练数据实例x进行构造以形成训练集;步骤S2,对多标签超网络进行定义:H=(V,E,W),其中V表示对应于数据特征的顶点集合,E表示一组超边,W=[w1,w2,...,w|E|]T表示一个实数矩阵,其中每一行代表一个特定超边的权重向量,在多标签超网络中,每个超边ei由三部分组成:顶点集标签向量yi=[yi1,yi2,...,yic]和权重向量wi=[wi1,wi2,...,wic],vi和yi是从训练数据实例x生成的,wi是从训练数据中获得的参数;每个训练数据实例x通过超边和超边权重向量wi与标签yi相关联起来,以形成超网络模型。3.根据权利要求2所述的一种基于多标签超网络的云用户行为认定方法,其特征在于:所述步骤S1训练集的形成过程如下:步骤S11:定义Dis来对用户的正常行为数据库中的数据特征的重要性进行度量,以评估各个特征向量的辨别能力,其中,Dp是一个特征向量与它最邻近的不同类特征向量之间的平均距离,Dq是一个特征向量与它最远的同类特征向量之间的平均距离,用行为实例S作为训练集,计算Dp和Dq,计算公式如下:其中j≠k且class(Vj)≠class(Vk);其中j≠k且class(Vj)=class(Vk);dis(Vj,Vk)用于表示两个近似特征向量Vj和Vk之间距离的任何度量;步骤S12,采用Czekanowski距离来评估两个...

【专利技术属性】
技术研发人员:刘若水郑瑞娟吴庆涛张明川朱军龙杜娟王鑫露陈亚明张凤华
申请(专利权)人:河南科技大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1