【技术实现步骤摘要】
随机游走、基于集群的随机游走方法、装置以及设备
本说明书涉及计算机软件
,尤其涉及随机游走、基于集群的随机游走方法、装置以及设备。
技术介绍
随着计算机和互联网技术的迅速发展,很多业务都可以在网上进行,图计算是处理社交方面的网上业务的一种常用手段。例如,对于社交风控业务中的账户欺诈识别:每个用户分别作为一个节点,若两个用户之间存在转账关系,则对应的两个节点之间存在一条边,边可以是无向的,也可以是根据转账方向定义了方向的;以此类推,可以得到包含多个节点和多条边的图数据,进而基于图数据进行图计算以实现风控。随机游走算法是图计算中比较基础和重要的一环,其为上层复杂算法提供支持。在现有技术中,一般采用这样的随机游走算法:在数据库中随机读取图数据包含的一个节点,再继续在该数据库中随机读取该节点的一个相邻节点,以此类推,实现在图数据中的随机游走。基于现有技术,需要能够应用于大规模图数据的更为高效的随机游走方案。
技术实现思路
本说明书实施例提供随机游走、基于集群的随机游走方法、装置以及设备,用以解决如下技术问题:需要能够应用于大规模图数据的更为高效的随机游走方案。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供的一种基于集群的随机游走方法,包括:所述集群获取图数据包含的各节点的信息;根据所述各节点的信息,生成哈希表,所述哈希表的键包括所述节点的标识,值包括所述节点的相邻节点的标识;根据所述哈希表,生成随机序列,所述随机序列反映在所述图数据中的随机游走。本说明书实施例提供的一种随机游走方法,包括:获取根据图数据包含的各节点的信息生成的哈希表,所述哈希 ...
【技术保护点】
1.一种基于集群的随机游走方法,包括:所述集群获取图数据包含的各节点的信息;根据所述各节点的信息,生成哈希表,所述哈希表的键包括所述节点的标识,值包括所述节点的相邻节点的标识;根据所述哈希表,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
【技术特征摘要】
1.一种基于集群的随机游走方法,包括:所述集群获取图数据包含的各节点的信息;根据所述各节点的信息,生成哈希表,所述哈希表的键包括所述节点的标识,值包括所述节点的相邻节点的标识;根据所述哈希表,生成随机序列,所述随机序列反映在所述图数据中的随机游走。2.如权利要求1所述的方法,所述集群包括服务器集群和工作机集群;所述集群获取图数据包含的各节点的信息,具体包括:所述工作机集群从数据库读取图数据包含的各节点的相邻节点的标识,其中,每个工作机读取一部分节点的相邻节点的标识。3.如权利要求2所述的方法,所述根据所述各节点的信息,生成哈希表,具体包括:各所述工作机分别根据自己读取标识的相邻节点及其对应节点的标识,生成非全量的哈希表;所述工作机集群将各所述非全量的哈希表向所述服务器集群同步;所述服务器集群根据各所述非全量的哈希表,得到全量的哈希表。4.如权利要求3所述的方法,所述根据所述哈希表,生成随机序列前,所述方法还包括:所述服务器集群将所述全量的哈希表向各所述工作机同步,以便各所述工作机根据所述全量的哈希表,生成随机序列。5.如权利要求2所述的方法,所述根据所述哈希表,生成随机序列,具体包括:所述工作机在所述各节点的标识中,随机确定一个标识,作为目标节点的标识;以所述目标节点的标识为键,在所述哈希表中索引得到对应的值,所述对应的值包括所述目标节点的相邻节点的标识;确定所述对应的值包括的相邻节点的标识的数量;随机确定一个小于所述数量的非负整数,并获取所述对应的值包括的第所述非负整数个相邻节点的标识;通过将该第所述非负整数个相邻节点重新作为目标节点进行迭代计算,生成由依次得到的各目标节点的标识构成的随机序列。6.如权利要求5所述的方法,所述对应的值存储于数组,所述目标节点的第n个相邻节点的标识为该数组的第n个元素,n从0开始计数;所述非负整数记作j,所述获取所述对应的值包括的第所述非负整数个相邻节点的标识,具体包括:通过读取该数组的第j个元素,获取所述目标节点的第j个相邻节点的标识。7.如权利要求5所述的方法,所述生成由依次得到的各目标节点的标识构成的随机序列,具体包括:当依次得到的各目标节点总数量达到预设的随机游走步数时,生成由所述依次得到的各目标节点的标识构成的随机序列。8.如权利要求2所述的方法,所述生成随机序列,具体包括:各所述工作机分别生成随机序列,直至生成的随机序列总数量达到设定阈值。9.如权利要求5所述的方法,所述方法还包括:所述工作机若本地已有的所述哈希表丢失,则重新从所述服务器集群获取。10.一种随机游走方法,包括:获取根据图数据包含的各节点的信息生成的哈希表,所述哈希表的键包括所述节点的标识,值包括所述节点的相邻节点的标识;根据所述哈希表,生成随机序列,所述随机序列反映在所述图数据中的随机游走。11.一种基于集群的随机游走装置,所述装置属于所述集群,包括:获取模块,获取图数据包含的各节点的信息;第一生成模块,根据所述各节点的信息,生成哈希表,所述哈希表的键包括所述节点的标识,值包括所述节点的相邻节点的标识;第二生成模块,根据所述哈希表,生成随机序列,所述随机序列反映在所述图数据中的随机游走。12.如权利要求11所述的装置,所述集群包括服务器集群和工作机集群;所述获取模块获取图数据包含的各节点的信息,具体包括:所述工作机集群从数据库读取图数据包含的各节点的相邻节点的标识,其中,每个...
【专利技术属性】
技术研发人员:曹绍升,杨新星,周俊,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。