虚拟人建立方法及装置制造方法及图纸

技术编号:11281386 阅读:91 留言:0更新日期:2015-04-09 15:05
本发明专利技术涉及一种基于行为日志的虚拟人建立方法及装置。该虚拟人建立方法包括:从行为日志中提取账号及与账号对应的登陆时间、登陆终端信息;根据账号之间协同出现的情况计算账号之间的相似度,构造以节点表征账号的连通图,并以节点之间的边的长度表征账号之间的相似度,节点之间的边越短,节点所表征的账号之间相似度越高;对所述连通图中的节点进行聚类,根据聚类结果建立虚拟人。本发明专利技术还涉及了一种虚拟人建立装置。本发明专利技术的虚拟人建立方法及装置基于行为日志建立虚拟人,复杂度低,准确率高,适合于处理大数据。

【技术实现步骤摘要】
虚拟人建立方法及装置
本专利技术涉及数据处理
,尤其涉及一种基于行为日志的虚拟人建立方法及装置。
技术介绍
当前,即时通讯,电子邮件,网络游戏,P2P软件下载,网络论坛,网络招聘,电子商务交易,网络预定机票酒店等各种网络服务给网络用户的生活带来极大的便利。各种网络服务一般会给每个用户分配一个帐号,该帐号跟用户的注册信息相关联并用以对各用户进行记录和识别,比如网络用户的即时通信号码(如QQ账号)或电子邮件地址,网络游戏帐号,论坛登陆帐号,以及P2P软件帐号等等。每个网络用户都拥有类型多样的账号,而大量的网络用户则带来的巨量的账号数据,对相关部门来说,有效管理网络用户信息已经成为艰巨的任务。为有效管理网络用户信息,实现对网络帐号归属关系的分析,即哪些帐号属于同一个人(虚拟人),现已成为亟需解决的问题。现有技术在面对构建虚拟人的问题时,大多归于属性匹配方式。属性匹配的方案大致如下:A)指定网络帐号属性匹配的规则,在哪种情况下用哪些属性进行匹配,以及相应的匹配成功判定方法。比如,当匹配一个QQ帐号和一个淘宝帐号时,如果两帐号的“姓名”和“联系方式”两个字段的编辑距离(editdista本文档来自技高网...
虚拟人建立方法及装置

【技术保护点】
一种虚拟人建立方法,其特征在于,包括如下步骤:从行为日志中提取账号及与账号对应的登陆时间、登陆终端信息;根据账号之间协同出现的情况计算账号之间的相似度,构造以节点表征账号的连通图,并以节点之间的边的长度表征账号之间的相似度,节点之间的边越短,节点所表征的账号之间相似度越高;对所述连通图中的节点进行聚类,根据聚类结果建立虚拟人。

【技术特征摘要】
2014.12.08 CN 20141074133441.一种虚拟人建立方法,其特征在于,包括如下步骤:从行为日志中提取账号及与账号对应的登陆时间、登陆终端信息;根据账号之间协同出现的情况计算账号之间的相似度,构造以节点表征账号的连通图,并以节点之间的边的长度表征账号之间的相似度,节点之间的边越短,节点所表征的账号之间相似度越高;对所述连通图中的节点进行聚类,根据聚类结果建立虚拟人;其中,对所述连通图中的节点进行聚类的过程包括如下步骤:分别求出每个节点的本地密度Rho,Rho定义为连接本节点的长度低于预定义值Dc的邻边的数目;分别求出每个节点的离散度Delta,Delta定义为本节点所有连接更高Rho值邻居节点的邻边中最短边的边长;若不存在这样的邻居节点,则取本节点最长邻边的边长;将Rho值和Delta值分别高于预设阈值R_T和D_T的节点标识为类的中心节点;将非中心节点归类为到该非中心节点距离最短且Rho值高于该非中心节点的中心节点所属的类;相同类的各个节点一同构成一个虚拟人。2.如权利要求1所述的虚拟人建立方法,其特征在于,还可引入账号之间协同出现的情况以外的因素计算所述账号之间的相似度。3.如权利要求1所述的虚拟人建立方法,其特征在于,采用K-Means方法或层次聚类方法对所述连通图中的节点进行聚类。4.如权利要求1所述的虚拟人建立方法,其特征在于,还包括合并所有虚拟人及与虚拟人对应的账号成为虚拟人...

【专利技术属性】
技术研发人员:蔡立宇贾西贝
申请(专利权)人:深圳市华傲数据技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1