一种多平台虚拟身份账号的多维碰撞识别方法技术

技术编号:24170476 阅读:39 留言:0更新日期:2020-05-16 02:47
本发明专利技术公开了一种多平台虚拟身份账号的多维碰撞识别方法,依次对不同社交平台虚拟身份账号的头像、属性和推文内容进行相似度匹配,若其中一个匹配成功,则认为这些虚拟身份账号属于一个用户,若无一匹配成功,则识别失败,认为它们不属于同一个用户。与现有技术相比,本发明专利技术的积极效果是:本发明专利技术提出的一种多平台虚拟身份账号的多维碰撞识别方法,针对不同平台的虚拟身份账号,提取头像、属性和推文等多个维度的特征,通过全方位多角度地碰撞比对,进而有效地对异源虚拟身份账号进行同一用户认定,其准确率能达到90%以上。

A multi-dimensional collision identification method of multi platform virtual identity account

【技术实现步骤摘要】
一种多平台虚拟身份账号的多维碰撞识别方法
本专利技术涉及一种多平台虚拟身份账号的多维碰撞识别方法。
技术介绍
在社会关系中,人的身份不仅是作为社会成员在生产和实践活动中区别于他人的标志和象征,更是与社会其他成员关系的纽带。个体在真实社会中的身份往往呈现出一种稳定、恒久和被动的特质。而网络社会则恰恰相反,人们在虚拟网络上可以平等、无障碍的沟通,可以自由随意的改变姓名、性别、年龄职业等基本信息,隐藏部分甚至全部的真实社会的特质,构建不同于现实社会身份的虚拟身份。另一方面,随着各种社交网络的诞生和发展,也使得世界各地的人们可以利用各种不同的虚拟身份随时分享、评论或讨论任何话题。信息的发布者不再仅仅是权威的新闻媒体,而是网络已匿名身份发布信息的广大网民,这使得互联网文化百花齐放百家争鸣的同时,也带来了一系列敏感而又现实的问题。多平台虚拟身份账号的多维碰撞识别技术即根据所获取的不同社交平台(例如微博,facebook和twitter)数据,识别出属于同一个用户的多个虚拟身份账号。该技术对于社交网络中社区圈子的识别(CommunityDetection)、基于好友关系为用户推荐商品或内容、社交网络中人物影响力的计算、信息在社交网络上的传播模型、虚假信息和机器人账号的识别、基于社交网络信息对股市、大选以及互联网金融行业中的反欺诈预测等领域都有着极强的研究价值和实际应用价值。
技术实现思路
为了克服现有技术的上述缺点,本专利技术提出了一种多平台虚拟身份账号的多维碰撞识别方法。本专利技术解决其技术问题所采用的技术方案是:一种多平台虚拟身份账号的多维碰撞识别方法,包括如下步骤:步骤一、对不同虚拟身份账号的头像进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则进入步骤二;步骤二、对不同虚拟身份账号的属性进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则进入步骤三;步骤三、对不同虚拟身份账号的推文进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则判断这些虚拟身份账号不属于同一个用户。与现有技术相比,本专利技术的积极效果是:本专利技术提出的一种多平台虚拟身份账号的多维碰撞识别方法,针对不同平台的虚拟身份账号,分别对头像、属性和推文开展多个维度的特征提取,通过全方位多角度地碰撞比对,进而有效地对异源虚拟身份账号进行同一用户识别,准确率能达到90%以上。附图说明本专利技术将通过例子并参照附图的方式说明,其中:图1为基于虚拟身份账号头像的虚拟身份关联技术框架;图2为预测训练模型的框架;图3为共同好友重叠的计算方式;图4为基于虚拟身份账号推文内容的虚拟身份账号关联技术框架;图5为虚拟身份账号关联流程图;图6为基于推文内容的虚拟身份账号关联技术实验结果。具体实施方式一种多平台虚拟身份账号的多维碰撞识别方法,包括如下内容:一、基于头像的虚拟身份账号关联技术基于头像的虚拟身份账号关联技术使用人脸识别技术对不同社交平台上的用户头像进行人脸验证进而判别是否是同一个用户,该技术框架如图1所示。主要分为人脸检测,人脸映射和基于距离进行身份关联三个步骤。由于虚拟身份账号的用户头像呈现形式多样,包含多人脸图像以及卡通图案、风景等非人脸图像,因此为了减少后期计算量和提高准确率,需首先将虚拟身份账号中抽取的头像信息进行过滤操作,移除集合中的多人脸图像和非人脸图像,仅保留单人脸图像,为后续的人脸映射提供最佳输入。为了能快速且精准的检测出头像中的人脸,在这里,使用经典的MTCNN人脸检测技术,利用三层级联架构结合精心设计的卷神经网络算法,对头像中的人脸进行定位。对于检测出的人脸检测框个数n=0和n>1的头像自动舍弃,对于n=1的头像则输出人脸检测结果。完成人脸检测操作后,针对不同虚拟身份社交账号的用户头像,该关联技术将检测出的人脸映射到公共的欧氏空间,并利用图像在欧几里得空间的距离实现不同头像的相似性检测。实现将检测出的人脸映射到欧氏空间主要基于一个预训练模型,模型的框架结构如图2所示。其中,网络的输入batch是指人脸图像样本,这里的样本是已经经过人脸检测找到人脸并裁剪到固定尺寸(例如160x160)的图片样本。进行特征提取的深度网络Deeparchitecture可以看作一个黑盒子,一般采用比较成熟的网络框架,比如经典Zeiler&Fergus架构和Google的Inceptionv1等。从图中可以发现,和传统的深度网络在最后连接softmax层不同的是,模型的最后连接的是特征归一化层(L2):即将原来的特征空间映射到新的特征空间,新的特征为原来特征的一种嵌入。最后的损失函数TriletLoss是针对三张图像构成的三元组,学习特征间的可分性:相同身份之间的特征距离要尽可能的小,而不同身份之间的特征距离要尽可能的大。经过上述步骤,不同社交平台(Facebook,Twitter)过滤后的所有人脸图像将会形成一个特征向量集合。遍历不同集合中的向量并计算不同集合中两两向量之间的欧氏距离即可获得异源账号头像的相似程度。在实验中,设置距离阈值T,若计算出的距离小于T,则认为这些异源账号属于同一个用户,反之,则认为不属于同一个用户。此外,若同一平台匹配出的异源虚拟身份账号有多个,则判定头像可能是公众人物,并予以舍弃操作。二、基于账号属性的虚拟身份账号关联技术在基于账号属性的虚拟身份账号关联技术中,每一个用户的所有简介属性被表示成一个向量。类似于网络搜索引擎中将网站表示为由文档单词组成的向量的方法,一个属性向量表示用户不同属性域(例如,电话号码、出生日期等)的信息集合。因此,一个n维的属性向量代表一个用户n个不同的属性域。定义1:一个属性向量P=<f1,f2,...,fn>,其中fi表示第i个属性域例如,一个包含三个域(n=3)的属性向量表示为:P1=<昵称、邮箱、出生日期>。算法对于两个向量P1和P2的比较包括两个阶段,第一阶段,算法利用字符串匹配函数来计算对应向量域之间的相似性得分,由此可获得一个相似性向量V。定义2:一个相似性向量V(P1,P2)=<v1,v2,...,vn>,其中vi=compi(fi,P1,fi,P2),0≤vi≤1,若|V|代表向量V的维数,则|V|=|P1|=|P2|compi是来自P1的属性域fi,P1和来自P2的属性域fi,P2的比较函数,返回一个[0,1]的值。如果fi,P1和fi,P2是完全相同的,那么vi=1;如果fi,P1和fi,P2没有相似性,那么vi=0。由于每个属性域的格式可能不一样,所以针对不同的属性域,函数compi也可能不同。例如,对于性别的比较返回一个整数值0或1,对于地址的比较可能产生一个有理数。在分析某些属性域时,可能需要比较复杂的逻辑来计算相似性得分。例如,当比较用户名时,本文档来自技高网...

【技术保护点】
1.一种多平台虚拟身份账号的多维碰撞识别方法,其特征在于:包括如下步骤:/n步骤一、对不同虚拟身份账号的头像进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则进入步骤二;/n步骤二、对不同虚拟身份账号的属性进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则进入步骤三;/n步骤三、对不同虚拟身份账号的推文进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则判断这些虚拟身份账号不属于同一个用户。/n

【技术特征摘要】
1.一种多平台虚拟身份账号的多维碰撞识别方法,其特征在于:包括如下步骤:
步骤一、对不同虚拟身份账号的头像进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则进入步骤二;
步骤二、对不同虚拟身份账号的属性进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则进入步骤三;
步骤三、对不同虚拟身份账号的推文进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则判断这些虚拟身份账号不属于同一个用户。


2.根据权利要求1所述的一种多平台虚拟身份账号的多维碰撞识别方法,其特征在于:步骤一所述对不同虚拟身份账号的头像进行相似度匹配的方法为:
第一步、人脸检测:将虚拟身份账号中抽取的头像信息进行过滤操作,移除集合中的多人脸图像和非人脸图像,仅保留单人脸图像;
第二步、人脸映射:将检测出的人脸映射到公共的欧氏空间,并利用图像在欧氏空间的距离实现不同头像的相似性检测;
第三步、基于距离进行身份关联:将不同社交平台过滤后的所有人脸图像形成一个特征向量集合,遍历不同集合中的向量并计算不同集合中两两向量之间的欧氏距离,然后判断计算出的距离是否小于设定的距离阈值,若是,则匹配成功,若否,则头像匹配不成功。


3.根据权利要求2所述的一种多平台虚拟身份账号的多维碰撞识别方法,其特征在于:在进行人脸检测时,使用MTCNN人脸检测技术,利用三层级联架构结合卷神经网络算法,对头像中的人脸进行定位;对于定位出的人脸检测框个数n=0和n>1的头像自动舍弃,对于n=1的头像则输出人脸检测结果。


4.根据权利要求2所述的一种多平台虚拟身份账号的多维碰撞识别方法,其特征在于:在进行人脸映射时,采用预训练模型将检测出的人脸映射到欧氏空间:模型的输入为经过人脸检测找出并裁剪到固定尺寸的人脸图像样本;特征提取的深度网络采用Zeiler&Fergus架构或Google的Inceptionv1,深度网络最后为特征归一化层:即将原来的特征空间映射到新的特征空间,损失函数为TriletLoss。


5.根据权利要求1所述的一种多平台虚拟身份账号的多维碰撞识别方法,其特征在于:步骤二所述对不同虚拟身份账号的属性进行相似度匹配的方法为:
第一步、将每一个用户的所有简介属性表示成一个属性向量P=<f1,f2,...,fn>,其中fi表示第i个属性域;
第二步、建立一个相似性向量V(P1,P2)=<v1,v2,...,vn>,其中vi=compi(fi,P1,fi,P2),0≤vi≤1,若|V|代表向量V的维数,则|V|=|P1|=|P2|;
第三步、定义权重向量W来控制每个属性域的影响力,并将相似性向量V和与它同维的权重向量W相乘获得两个属性向量P1和P2的相似性得分,然后判断相似性得分是否大于设定的阈值:若是,则匹配成功,若否,则属性匹配不成功。


6.根据权利要求5所述的一种多平台虚拟身份账号的多维碰撞识别方法...

【专利技术属性】
技术研发人员:徐舒霖胥小波聂小明王伟康英来范晓波敖佳
申请(专利权)人:中国电子科技网络信息安全有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1