【技术实现步骤摘要】
一种数据处理方法及装置
[0001]本说明书涉及数据处理领域,尤其涉及一种数据处理方法及装置。
技术介绍
[0002]图表征学习的算法发展越来越精细化,针对关系图中的节点和/或边的某种属性进行的子图采样的需求越来越大,即如何更快速地从关系图中的各节点的邻居节点集中确定出合适的邻居节点至关重要。
[0003]那么,如何提供一种更快速地从关系图中的各节点的邻居节点集中确定出合适的邻居节点的方法成为亟待解决的问题。
技术实现思路
[0004]本说明书一个或多个实施例提供了一种数据处理方法及装置,以实现更快速地从关系图中的各节点的邻居节点集中确定出合适的邻居节点。
[0005]根据第一方面,提供一种数据处理方法,包括:
[0006]读取第一节点对应的第一邻居列表,以及对应的第一索引数据,所述第一索引数据包括,根据所述第一邻居列表中各邻居节点的第一属性的值而整理的若干邻居节点的指示数据;
[0007]基于所述第一索引数据,从所述第一邻居列表,筛选出满足第一过滤表达式的若干第一邻居节点,其 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:读取第一节点对应的第一邻居列表,以及对应的第一索引数据,所述第一索引数据包括,根据所述第一邻居列表中各邻居节点的第一属性的值而整理的若干邻居节点的指示数据;基于所述第一索引数据,从所述第一邻居列表,筛选出满足第一过滤表达式的若干第一邻居节点,其中所述第一过滤表达式针对所述第一属性而设置。2.如权利要求1所述的方法,还包括:从所述若干第一邻居节点中,采样出若干第二邻居节点,作为所述第一节点的采样邻居节点。3.如权利要求1所述的方法,所述读取第一节点对应的第一邻居列表,包括:从当前采样结果集中,读取所述第一节点的节点标识;根据所述节点标识,从原始图的邻接数据集中读取第一键值对,所述第一键值对中的键为所述节点标识;读取所述第一键值对中的值,作为所述第一邻居列表。4.如权利要求1所述的方法,其中,所述第一节点,为原始图中预设的种子节点;或者在针对原始图中预设的种子节点进行第i+1跳邻居节点采样时,为原始图中预设的种子节点的第i跳的采样邻居节点。5.如权利要求1所述的方法,所述第一属性为所述第一邻居列表中邻居节点与所述第一节点之间的边的属性,或所述第一邻居列表中邻居节点的属性。6.如权利要求1所述的方法,所述指示数据为,所述邻居节点在所述第一邻居列表中的位置编号。7.如权利要求1所述的方法,所述第一属性为类别型属性,具有多个类别值;所述第一索引数据包括,对应于所述多个类别值的多个节点组各自的指示数据。8.如权利要求7所述的方法,还包括:将所述第一邻居列表中、所对应第一属性的类别值相同的邻居节点的指示数据划分为一组,得到若干组节点组,以构建得到所述第一索引数据,各节点组分别包括所对应第一属性的类别值相同的若干邻居节点的指示数据。9.如权利要求7所述的方法,所述基于所述第一索引数据,从所述第一邻居列表,筛选出满足第一过滤表达式的若干第一邻居节点,包括:基于所述第一索引数据,确定所述第一过滤表达式涉及的第一属性的类别值对应的节点组,作为目标节点组;基于所述目标节点组,确定满足第一过滤表达式的若干第一邻居节点。10.如权利要求1所述的方法,其中,所述第一属性为数值型属性;所述第一索引数据包括:按照所对应第一属性的值的大小排序的若干邻居节点的指示数据。11.如权利要求10所述的方法,还包括:将所述第一邻居列表中各邻居节点的指示数据,按照所述第一邻居列表中各邻居节点的所述第一属性的值的大小进行排序;基于排序所得结果,确定所述第一索引数据。12.如权利要求10所述的方法,其中,所述第一过滤表达式...
【专利技术属性】
技术研发人员:胡志洋,宋宪政,张大龙,李杨,武潺,王琳,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。