一种身份欺骗检测方法及其系统、装置、存储介质制造方法及图纸

技术编号：22330504 阅读：47 留言：0更新日期：2019-10-19 12:21

本发明专利技术公开了一种身份欺骗检测方法及其系统、装置、存储介质，由身份欺骗检测机器学习模型和身份欺骗检测评分模型组成。身份欺骗检测机器学习模型采用监督机器学习来识别SMP上与身份相关的信息的适当属性和特征，同时计算这些属性和特征的准确性和熵信息，确定身份是否具有欺骗性。身份欺骗检测评分模型使用熵信息来确定属性和特征的重要性。然后将此信息用作线性公式中的加权变量,以确定身份是否具有欺骗性。本发明专利技术通过智能检测欺骗身份的账户，将恶意用户在SMP上利用的身份欺骗的网络风险降至最低，不仅可以检测，同时还可以解释感知欺骗性。

全部详细技术资料下载

【技术实现步骤摘要】
一种身份欺骗检测方法及其系统、装置、存储介质
本专利技术涉及网络安全
，尤其是一种基于监督机器学习在社交媒体平台上的身份欺骗检测方法及其系统、装置、存储介质。
技术介绍
目前网络威胁十分普遍，社交媒体平台(SocialMediaPlatform，SMP)是网络攻击的推动者。SMP很容易受到网络威胁,因为它们在没有任何权威验证或验证参与者的情况下在个人之间建立信任。网络犯罪可能会产生严重后果。过去的研究人员利用在SMP上发现的属性来构建可以检测到身份欺骗的新特征。比如可以通过发现性别和为人类选择的预期背景颜色的不一致之处,审查身份欺骗特征；地理位置更新时间存在统计不一致之处,有助于发现欺骗性账户；还可以从内容中使用的语言和当地文本中得出性别和位置等特征。其他的一些特征，如配置文件图像是否真实地代表用户,名称等属性的相似性，以及给定的用户的情绪状态等，也被认为对检测身份欺骗有潜在的有用价值。此外,研究人员还提出了在SMP上检测身份欺骗的各种技术。这些技术包括过滤、规则、监督机器学习、半监督机器学习、加强学习和无监督机器学习，这与目前的研究有协同作用。因此,以往对机器人检测的研究被用来确定合适的监督机器学习算法,供考虑的研究使用。在机器学习中,没有通用算法的性能预期超过其余算法,也称为"没有免费午餐"定理。因此,需要在同一问题上测试各种算法。在机器人检测研究中发现的八个机器学习模型,被应用于这项研究中,以检测欺骗性的人类。然而,监督机器学习模型输出的结果存在技术缺陷,这些结果很少是可以解释和直观的。因此，如何将恶意用户在SMP上利用的身份欺骗的网络风险降至...

【技术保护点】
1.一种身份欺骗检测方法，其特征在于：包括身份欺骗检测机器学习模型和身份欺骗检测评分模型，通过身份欺骗检测机器学习模型来识别社交媒体平台上与身份相关的信息属性和信息特征，计算信息属性和信息特征的准确性以及熵信息，确定身份是否具有欺骗性；通过身份欺骗检测评分模型来使用熵信息来确定信息属性和信息特征的重要性，将熵信息用作线性公式中的加权变量,以确定身份是否具有欺骗性。

【技术特征摘要】
1.一种身份欺骗检测方法，其特征在于：包括身份欺骗检测机器学习模型和身份欺骗检测评分模型，通过身份欺骗检测机器学习模型来识别社交媒体平台上与身份相关的信息属性和信息特征，计算信息属性和信息特征的准确性以及熵信息，确定身份是否具有欺骗性；通过身份欺骗检测评分模型来使用熵信息来确定信息属性和信息特征的重要性，将熵信息用作线性公式中的加权变量,以确定身份是否具有欺骗性。2.根据权利要求1所述的一种身份欺骗检测方法，其特征在于，所述身份欺骗检测机器学习模型，包括如下步骤：S1，假设SMP是一个社交媒体平台，A＝{a1,a2,…,an}是SMP属性的子集，A＝A1∪A2，其中，A1＝{a1,a2,…,an}是随机抽取的训练数据集，A2＝{a1,a2,…,an}是随机抽取的测试数据集，A1与A2在A中所占比例为3:1；S2，设F＝{f1,f2,…,fm}是一组特征，m是特征的数量，其中，fi∈A∨fi＝f(aj,…,ak)，j≥1，k≤n；S3，RF＝{h(x|θ1),h(x|θ2),…,h(x|θt)}，其中，RF是随机森林算法，t是决策树数量，h(x|θi)是其中的单个决策树，x是给定θi的A1∨F的值,1≤i≤t；S4，设其中，RFresults是随机森林的结果，f1i是一个F1值，ei是一个熵值；S5，设A3＝{ai∨fi:根据f(fi,ei)}产生的集合中的最佳值进行选择}，其中，1<i≤n,S6，设Mi是Up的最终...

【专利技术属性】
技术研发人员：邱天，李千目，龙华秋，刘耀宗，容振邦，
申请(专利权)人：五邑大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人