MapReduce平台上的虚拟人建立方法技术

技术编号:12174305 阅读:129 留言:0更新日期:2015-10-08 11:36
本发明专利技术涉及一种MapReduce平台上的虚拟人建立方法。该虚拟人建立方法包括:步骤1、从行为日志中提取账号及与账号对应的登陆时间、登陆终端信息;步骤2、根据账号之间协同出现的情况计算账号之间的相似度,构造以节点表征账号的连通图,并以节点之间的边的长度表征账号之间的相似度,节点之间的边越短,节点所表征的账号之间相似度越高;步骤3、基于MapReduce平台对所述连通图中的节点进行聚类,根据聚类结果建立虚拟人。本发明专利技术基于行为日志建立虚拟人,复杂度低,准确率高,适合于处理大数据;借助流行的MapReduce分布式计算思想在集群上实现了基于本地密度的聚类,弱化了处理时单机本身资源有限等所带来的限制,能实现对海量数据的处理,更快的完成聚类操作。

【技术实现步骤摘要】

本专利技术设及数据处理
,尤其设及一种MapRe化ce平台上的虚拟人建立方 法。
技术介绍
当前,即时通讯,电子邮件,网络游戏,P2P软件下载,网络论坛,网络招聘,电子商 务交易,网络预定机票酒店等各种网络服务给网络用户的生活带来极大的便利。各种网络 服务一般会给每个用户分配一个帐号,该帐号跟用户的注册信息相关联并用W对各用户进 行记录和识别,比如网络用户的即时通信号码(如QQ账号)或电子邮件地址,网络游戏帐 号,论坛登陆帐号,W及P2P软件帐号等等。 每个网络用户都拥有类型多样的账号,而大量的网络用户则带来的巨量的账号数 据,对相关部口来说,有效管理网络用户信息已经成为艰巨的任务。为有效管理网络用户信 息,实现对网络帐号归属关系的分析,即哪些帐号属于同一个人(虚拟人),现已成为亟需 解决的问题。 现有技术在面对构建虚拟人的问题时,大多归于属性匹配方式。属性匹配的方案 大致如下: A)指定网络帐号属性匹配的规则,在哪种情况下用哪些属性进行匹配,W及相应 的匹配成功判定方法。比如,当匹配一个QQ帐号和一个淘宝帐号时,如果两帐号的"姓名" 和"联系方式"两个字段的编辑本文档来自技高网...

【技术保护点】
一种MapReduce平台上的虚拟人建立方法,其特征在于,包括:步骤1、从行为日志中提取账号及与账号对应的登陆时间、登陆终端信息;步骤2、根据账号之间协同出现的情况计算账号之间的相似度,构造以节点表征账号的连通图,并以节点之间的边的长度表征账号之间的相似度,节点之间的边越短,节点所表征的账号之间相似度越高;步骤3、基于MapReduce平台对所述连通图中的节点进行聚类,根据聚类结果建立虚拟人。

【技术特征摘要】

【专利技术属性】
技术研发人员:蔡立宇张观成喻勇杨航范亚博贾西贝
申请(专利权)人:深圳市华傲数据技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1