当前位置: 首页 > 专利查询>长安大学专利>正文

一种基于混合特征值的托攻击检测方法技术

技术编号:21479101 阅读:51 留言:0更新日期:2019-06-29 05:08
本发明专利技术公开了一种基于混合特征值的托攻击检测方法,该方法针对传统的基于评分值差异提取的特征在检测托攻击时误判率过高的问题,采用了Degsim,MeanVar,WDA,CHIP,CHIN五个特征值,与现有技术对比,考虑了项目与流行项目、项目与新颖项目之间的关联程度。通过分析真实用户和攻击用户评分项目选择方式的不同,准确检测出攻击用户。通过应用到具体实施例中发现,该方法准确率高于PCA检测算法。

【技术实现步骤摘要】
一种基于混合特征值的托攻击检测方法
本专利技术属于信息安全领域,具体涉及一种基于混合特征值的托攻击检测方法。
技术介绍
协同过滤推荐系统可以通过分析用户的各种习惯和操作来判断并帮助用户快速的找到其所需要的信息,它的出现使“信息爆炸”现象得到一定的缓解。托攻击是指托攻击者利用协同过滤具有开放性的特点,通过注入虚假用户评价的方式来提高或降低商品的推荐率,分别被称为推攻击与核攻击。为了最大程度的解决这个问题,研究者们提出了多种托攻击检测方法,其中大多都是针对真实用户和虚假用户的评分的差异性来进行检测,并取得了一定的成果,但是随着攻击手段更加高明,如何准确的检测出攻击用户变成现在的热点问题之一。
技术实现思路
本专利技术的目的在于克服上述现有技术的缺点,通过分析真实用户和攻击用户评分项目选择方式的不同,提出了一种基于混合特征值的托攻击检测方法,该方法通过采用Degsim,MeanVar,WDA,CHIP,CHIN五个特征值,准确检测出攻击用户。为达到上述目的,本专利技术采用以下技术方案予以实现:一种基于混合特征值的托攻击检测方法,包括以下步骤:步骤1,选取真实用户数据集和攻击用户数据本文档来自技高网...

【技术保护点】
1.一种基于混合特征值的托攻击检测方法,其特征在于,包括以下步骤:步骤1,选取真实用户数据集和攻击用户数据集,混合后得到混合矩阵数据集;步骤2,针对混合矩阵数据集中的每个用户的近邻平均用户相似度、均值方差,加权评分一致度,流行项目的卡方估计值和新颖项目的卡方估计值五个特征值进行特征提取,得到五个特征向量;步骤3,将所有用户的近邻平均用户相似度、均值方差和加权评分一致度三个特征向量共同组成一个矩阵,通过K‑means聚类算法将该矩阵分为两类,为第一真实用户集合和第一攻击用户集合;步骤4,将流行项目的卡方估计值的特征向量和第一阈值比较,将新颖项目的卡方估计值的特征向量和第二阈值比较,将这两个特征向...

【技术特征摘要】
1.一种基于混合特征值的托攻击检测方法,其特征在于,包括以下步骤:步骤1,选取真实用户数据集和攻击用户数据集,混合后得到混合矩阵数据集;步骤2,针对混合矩阵数据集中的每个用户的近邻平均用户相似度、均值方差,加权评分一致度,流行项目的卡方估计值和新颖项目的卡方估计值五个特征值进行特征提取,得到五个特征向量;步骤3,将所有用户的近邻平均用户相似度、均值方差和加权评分一致度三个特征向量共同组成一个矩阵,通过K-means聚类算法将该矩阵分为两类,为第一真实用户集合和第一攻击用户集合;步骤4,将流行项目的卡方估计值的特征向量和第一阈值比较,将新颖项目的卡方估计值的特征向量和第二阈值比较,将这两个特征向量均大于各自阈值的用户设定为真实用户,将这两个特征向量均小于各自阈值的用户标记为攻击用户,得到第二真实用户集合和第二攻击用户集合;步骤5,将步骤3和步骤4得到的第一攻击用户集合和第二攻击用户集合进行交集运算,得到最终攻击用户集合,剩余的用户为真实用户集合。2.根据权利要求1所述的一种基于混合特征值的托攻击检测方法,其特征在于,步骤1中,攻击用户数据集和真实用户数据集的混合模型为流行攻击模型。3.根据权利要求1所述的一种基于混合特征值的托攻击检测方法,其特征在于,步骤2具体包括以下步骤:步骤2.1,将混合矩阵数据集输入至Matlab程序中,其中用户用U={u1,u2,u3...}来表示,项目用I={i1,i2,i3....}表示,U为混合矩阵数据集的行,I为混合矩阵数据集的列;步骤2.2,提取每个用户的近邻平均用户相似度、均值方差,加权评分一致度,流行项目的卡方估计值和新颖项目的卡方估计值五个特征值;(1)DegSim表示近邻平均用户相似度,,第u个用户的DegSim计算公式如下式(5):其中,是皮尔逊相似度,u,v表示数据集DATE中两个不同的用户,r表示用户u对项目的评分,k指要选取最近的用户数目;(2)MeanVar表示均值方差,第u个用户的MeanVar的计算公式如下式(6):其中,PU,F是用户U的所有评分项目中把最高的评分减去之后剩下的集合项目,|Pu,F|是指该集合中所有项目的总数,ru,j为用户u对填充项目j的评分值,为用户u对项目的平均评分;(3)WDA表示加权评分一致度,第u个用户的加权评分一致度的计算公式如下式(7)所示:其中,Nu表示用户u评价过的项目个数,NRi表示项目i被评价过的次数,ri表示项目i的评分均值,ru,i表示用户u对项目i的评分;(4)CHIP表示流行项目的卡方估计值,其计算公式如下式(8)所示:其中,I表示数据集中所有的项目,A表示既属于有评分项目集合又属于流行项目集合的个数,B表示属于有评分的项目集合但是不属于流行项目集合的个数,C表示不属于有评分项目的集合却属于流行项目的集合个数,D表示既不属于有评...

【专利技术属性】
技术研发人员:雷梦宁王新美方腾源何永泰张宇
申请(专利权)人:长安大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1