用户身份识别方法、装置及服务器制造方法及图纸

技术编号:22077015 阅读:28 留言:0更新日期:2019-09-12 14:35
本发明专利技术提供了一种用户身份识别方法、装置及服务器,该方法包括:从多个社交网络中获取待识别的未知用户的公开数据;对所述未知用户的公开数据进行聚类分析,得到至少一个相似用户群;分别获取预设时间间隔内所述相似用户群中的每个未知用户与各所述社交网络中已知用户的关联信息;根据所述关联信息,从所述相似用户群中识别出具有同一身份的用户。本发明专利技术可以有效提高用户身份识别的准确率。

User Identity Recognition Method, Device and Server

【技术实现步骤摘要】
用户身份识别方法、装置及服务器
本专利技术涉及社交网络
,尤其是涉及一种用户身份识别方法、装置及服务器。
技术介绍
随着互联网的发展,诸如腾讯微博、新浪微博和人人网等多种社交网络出现逐渐在用户的视野中,用户可以活跃于各种社交网络中以不同形象与他人进行交互,产生散布在各个社交网络的独立数据集,例如,用户X在社交网络1中通过账号A与他人交互,在社交网络2中通过账号B与他人交互,在社交网站3中通过账号C与他人交互,所用的不同账号下的信息可能相同或不同,诸如在社交网络1中的名称为“张三”,在社交网络2中的名称为“李四”等,但在社交网络1~3中的性别都设定为“男”,年龄均设定为“28”岁。因此社交网络1、社交网络2和社交网络3中均存在用户X的独立数据集,将用户X的散布于各个社交网络的独立数据集关联起来,对许多数据挖掘分析意义重大。将用户散布于各个社交网络的独立数据关联起来的前提是在各个社交网络中识别出具有同一身份的用户,现有技术中,通常是通过获取用户在社交网站中公开的用户资料判断多个社交网站上的某个账号是否属于同一用户,该方式受公开资料的限制较大,若用户公开资料不准确或者公开资料不全,则本文档来自技高网...

【技术保护点】
1.一种用户身份识别方法,其特征在于,包括:从多个社交网络中获取待识别的未知用户的公开数据;对所述未知用户的公开数据进行聚类分析,得到至少一个相似用户群;分别获取预设时间间隔内所述相似用户群中的每个未知用户与各所述社交网络中已知用户的关联信息;根据所述关联信息,从所述相似用户群中识别出具有同一身份的用户。

【技术特征摘要】
1.一种用户身份识别方法,其特征在于,包括:从多个社交网络中获取待识别的未知用户的公开数据;对所述未知用户的公开数据进行聚类分析,得到至少一个相似用户群;分别获取预设时间间隔内所述相似用户群中的每个未知用户与各所述社交网络中已知用户的关联信息;根据所述关联信息,从所述相似用户群中识别出具有同一身份的用户。2.根据权利要求1所述的方法,其特征在于,所述对所述未知用户的公开数据进行聚类分析,得到至少一个相似用户群的步骤,包括:通过OPTICS算法或DBSCAN算法计算所述未知用户的公开数据的相似性度量,基于所述相似性度量得到至少一个相似用户群。3.根据权利要求2所述的方法,其特征在于,所述公开数据包括可编辑数据和非编辑数据;所述通过OPTICS算法或DBSCAN算法计算所述未知用户的公开数据的相似性度量的步骤,包括:统计所述公开数据中非编辑数据相同的未知用户,得到数据相同数量;并计算所述公开数据中可编辑数据的数据相似值;根据所述数据相同数量和所述数据相似值计算所述未知用户的公开数据的相似性度量。4.根据权利要求1所述的方法,其特征在于,所述根据所述关联信息,从所述相似用户群中识别出具有同一身份的用户的步骤,包括:根据所述关联信息,计算所述相似用户群中每个未知用户针对各所述社交网络的相似值;根据所述相似值,从所述相似用户群中分别识别出具有同一身份的用户。5.根据权利要求4所述的方法,其特征在于,所述根据所述关联信息,计算所述相似用户群中每个未知用户针对各所述社交网络的相似值的步骤,包括:按照以下...

【专利技术属性】
技术研发人员:王晓袁春峰纪翀
申请(专利权)人:南京中孚信息技术有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1