数据处理方法、装置、计算机可读介质及电子设备制造方法及图纸

技术编号:30403906 阅读:24 留言:0更新日期:2021-10-20 10:58
本申请属于人工智能技术领域,具体涉及一种数据处理方法、数据处理装置、计算机可读介质以及电子设备。该方法包括:获取用于表示多个交互对象之间的交互关系的关系图网络,所述关系图网络包括用于表示交互对象的节点和用于表示交互关系的边;通过包括多个计算设备的设备集群对所述关系图网络进行核心度挖掘,以迭代更新所述关系图网络中的全部节点或者部分节点的节点核心度;根据所述节点核心度对所述关系图网络进行剪枝处理,以移除所述关系图网络中的部分节点和边;当所述关系图网络的网络规模满足预设的网络压缩条件时,对所述设备集群进行压缩处理以移除所述设备集群中的部分计算设备。该方法可以降低计算资源的消耗并提高数据处理效率。提高数据处理效率。提高数据处理效率。

【技术实现步骤摘要】
数据处理方法、装置、计算机可读介质及电子设备


[0001]本申请属于人工智能
,具体涉及一种数据处理方法、数据处理装置、计算机可读介质以及电子设备。

技术介绍

[0002]随着计算机和网络技术的发展,在网络平台提供业务服务的基础上,用户相互之间可以建立各种各样的交互关系,例如用户可以在网络社交平台上以与其他用户建立社交关系,也可以在网络支付平台上与其他用户建立资金往来关系。在此基础上,网络平台也将积累大量的用户数据,其中包含了用户使用网络平台时产生的与自身属性相关的数据,同时也包含了不同用户之间建立交互关系而产生的交互数据。
[0003]合理地对用户数据进行梳理和挖掘可以使网络平台能够结合用户特点更好地为用户提供便利高效的平台服务。然而,随着用户数据的不断积累,越来越庞大的数据规模将会带来日益增大的数据处理压力,网络平台也需要花费越来越多的计算资源和时间来进行数据分析。因此,如何提高大数据分析的效率并降低相关成本是目前亟待解决的问题。

技术实现思路

[0004]本申请的目的在于提供一种数据处理方法、数据处理装置、计本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取用于表示多个交互对象之间的交互关系的关系图网络,所述关系图网络包括用于表示交互对象的节点和用于表示交互关系的边;通过包括多个计算设备的设备集群对所述关系图网络进行核心度挖掘,以迭代更新所述关系图网络中的全部节点或者部分节点的节点核心度;根据所述节点核心度对所述关系图网络进行剪枝处理,以移除所述关系图网络中的部分节点和边;当所述关系图网络的网络规模满足预设的网络压缩条件时,对所述设备集群进行压缩处理以移除所述设备集群中的部分计算设备。2.根据权利要求1所述的数据处理方法,其特征在于,所述对所述设备集群进行压缩处理以移除所述设备集群中的部分计算设备,包括:在所述设备集群中选取一个计算设备作为对所述关系图模型进行单机计算的目标节点,并从所述设备集群中移除除所述目标节点以外的其他计算设备。3.根据权利要求1所述的数据处理方法,其特征在于,所述通过包括多个计算设备的设备集群对所述关系图网络进行核心度挖掘,以迭代更新所述关系图网络中的各个节点的节点核心度,包括:对所述关系图网络进行分割处理,得到由所述关系图网络中的部分节点和边组成的分区图网络;将所述分区图网络分配至包括多个计算设备的设备集群,以确定用于对所述分区图网络进行核心度挖掘的计算设备;对所述分区图网络进行核心度挖掘,以迭代更新所述关系图网络中的各个节点的节点核心度。4.根据权利要求3所述的数据处理方法,其特征在于,所述对所述分区图网络进行核心度挖掘,以迭代更新所述关系图网络中的各个节点的节点核心度,包括:在所述分区图网络中选取在当前迭代轮次中进行核心度挖掘的计算节点,并确定与所述计算节点具有邻接关系的邻居节点;获取所述计算节点以及所述邻居节点在当前迭代轮次中的当前节点核心度;根据所述邻居节点的当前节点核心度确定所述计算节点的临时节点核心度,并将所述临时节点核心度小于当前节点核心度的计算节点标记为活跃节点;根据所述临时节点核心度更新所述活跃节点的当前节点核心度,并将所述活跃节点以及与所述活跃节点具有邻接关系的邻居节点确定为在下一迭代轮次中进行核心度挖掘的计算节点。5.根据权利要求4所述的数据处理方法,其特征在于,所述根据所述邻居节点的当前节点核心度确定所述计算节点的临时节点核心度,包括:根据所述邻居节点的当前节点核心度确定所述计算节点的h指数,并将所述h指数作为所述计算节点的临时节点核心度,所述h指数表示在所述计算节点的所有邻居节点中至多包括h个邻居节点的当前节点核心度大于或等于h。6.根据权利要求5所述的数据处理方法,其特征在于,所述根据所述邻居节点的当前节点核心度确定所述计算节点的h指数,包括:
按照所述当前节点核心度由高到低的顺序对所述计算节点的所有邻居节点进行排序,并为各个所述邻居节点分配以0起始的排列序号;分别比较各个邻居节点的排列序号和当前节点核心度,以根据比较结果筛选排列序号大于或等于当前节点核心度的邻居节点;在筛选出的邻居节点中,将排列序号最小的邻居节点的当前节点核心度确定为所述计算节点的h指数。7.根据权利要求4所述的数据处理方法,其特征在于,所述在所述分区图网络中选取在当前迭代轮次中进行核心度挖掘的计算节点,包括:从第一存储空间中读取待更新节点的节点标识,所述待更新节点包括在前一迭代轮次中更新节点...

【专利技术属性】
技术研发人员:李晓森许杰欧阳文陶阳宇肖品
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1