数据处理方法、相关装置及介质制造方法及图纸

技术编号:39244326 阅读:7 留言:0更新日期:2023-10-30 11:56
本公开提供了一种数据处理方法、相关装置及介质。该数据处理方法包括:获取多个场景中的对象关系数据、和各个对象的对象动作关联数据;基于对象关系数据,生成多场景要素互联图谱中的对象要素节点、和对象要素节点之间的关系;基于对象动作关联数据,在多场景要素互联图谱中,生成辅助要素节点、以及对象要素节点与辅助要素节点的关系;从多场景要素互联图谱中,提取每种类型的要素节点对应的子图;利用图神经网络,将子图编码为子图对应的多场景要素关系向量,用于对应的任务预测。本公开用于数据处理、知识图谱等领域。本公开实施例能提高应用的多场景下数据建模的效率,减少资源占用,增加建模出的数据的稠密度。增加建模出的数据的稠密度。增加建模出的数据的稠密度。

【技术实现步骤摘要】
数据处理方法、相关装置及介质


[0001]本公开涉及大数据领域,特别是涉及一种数据处理方法、相关装置及介质。

技术介绍

[0002]随着互联网的快速发展,很多应用或平台都融合了大量场景。例如,即时通信应用中可能除了即时会话外,还融合了对象群、频道、空间、小视频等功能,每个功能是一个场景。对象在每种场景中都与某些特定的其它对象建立关联(加好友等),且对象在每种场景中都对场景中的内容产生了一定动作,例如对小视频点赞,或对频道中的文章转发。现有技术中,在每种场景中有独立的数据建模方式,或者对该场景中对象之间的关系建模,或者对该场景中对象的动作数据建模,数据建模后馈送给相应的任务预测模型进行任务预测(例如内容推荐)。
[0003]现有技术在应用的多场景下数据建模的效率不高,引起较大资源占用,且建模出的数据较稀疏。

技术实现思路

[0004]本公开实施例提供了一种数据处理方法、相关装置及介质,它能够提高应用的多场景下数据建模的效率,减少资源占用,增加建模出的数据的稠密度。
[0005]根据本公开的一方面,提供了数据处理方法,包括:
[0006]获取多个场景中的对象关系数据、和各个所述对象的对象动作关联数据;
[0007]基于多个所述场景中的所述对象关系数据,生成多场景要素互联图谱中的对象要素节点、和所述对象要素节点之间的关系,其中,所述多场景要素互联图谱具有多个要素节点,多个所述要素节点包括所述对象要素节点和辅助要素节点;
[0008]基于多个所述场景中的各个所述对象的对象动作关联数据,在所述多场景要素互联图谱中,生成所述辅助要素节点、以及所述对象要素节点与所述辅助要素节点的关系;
[0009]从所述多场景要素互联图谱中,提取每种类型的所述要素节点对应的子图;
[0010]利用图神经网络,将所述子图编码为所述子图对应的多场景要素关系向量,用于所述子图对应的任务预测。
[0011]根据本公开的一方面,提供了数据处理装置,包括:
[0012]第一获取单元,用于获取在多个场景中的对象关系数据、和各个所述对象的对象动作关联数据;
[0013]第一生成单元,用于基于多个所述场景中的所述对象关系数据,生成多场景要素互联图谱中的对象要素节点、和所述对象要素节点之间的关系,其中,所述多场景要素互联图谱具有多个要素节点,多个所述要素节点包括所述对象要素节点和辅助要素节点;
[0014]第二生成单元,用于基于多个所述场景中的各个所述对象的对象动作关联数据,在所述多场景要素互联图谱中,生成所述辅助要素节点、以及所述对象要素节点与所述辅助要素节点的关系;
[0015]提取单元,用于从所述多场景要素互联图谱中,提取每种类型的所述要素节点对应的子图;
[0016]任务预测单元,用于利用图神经网络,将所述子图编码为所述子图对应的多场景要素关系向量,用于所述子图对应的任务预测。
[0017]可选地,所述第二生成单元具体用于:
[0018]建立所述辅助要素节点的各个类型对应的子空间;
[0019]基于多个所述场景中的各个所述对象的对象动作关联数据,获取各个所述类型的辅助要素节点数据,放入所述类型对应的所述子空间中;
[0020]基于每个所述子空间中的所述辅助要素节点数据,在所述多场景要素互联图谱中,生成所述辅助要素节点、以及所述对象要素节点与所述辅助要素节点的关系。
[0021]可选地,所述对象动作关联数据包括施动对象信息、受动体信息、和动作信息;所述第二生成单元用于:
[0022]将所述受动体信息作为所述辅助要素节点数据的数据体,将所述施动对象信息和所述动作信息作为所述辅助要素节点数据的属性,放入所述类型对应的所述子空间中;
[0023]基于所述数据体,在所述多场景要素互联图谱中,生成所述辅助要素节点,且基于所述属性,在所述多场景要素互联图谱中,生成所述对象要素节点与所述辅助要素节点的关系;
[0024]所述提取单元具体用于:
[0025]从所述多场景要素互联图谱中,提取对象要素节点和每种类型的所述要素节点,并提取所述对象要素节点与所述辅助要素节点的关系,以构成所述子图。
[0026]可选地,所述对象动作关联数据包括:所述对象与内容的第一交互数据、所述对象与内容作者的第二交互数据、所述对象与推荐活动项的第三交互数据;所述辅助要素节点数据包括:对象兴趣标签节点数据、内容节点数据、内容作者节点数据、和推荐活动节点数据;
[0027]所述第二生成单元具体用于:
[0028]基于所述第一交互数据,生成所述内容节点数据,放入所述内容节点数据对应的第一子空间中;
[0029]基于所述第二交互数据,生成所述内容作者节点数据,放入所述内容作者节点数据对应的第二子空间中;
[0030]基于所述第三交互数据,生成所述推荐活动节点数据,放入所述推荐活动节点数据对应的第三子空间中;
[0031]基于对象与各个所述内容的所述第一交互数据,生成所述对象兴趣标签节点数据,放入所述对象兴趣标签节点数据对应的第四子空间中。
[0032]可选地,所述第二生成单元具体用于:
[0033]从所述第一交互数据中,获取所述对象交互过的所述内容的内容标签:
[0034]针对每个所述内容标签,确定所述对象交互过的所述内容中携带有所述内容标签的内容数目;
[0035]如果所述内容数目符合预定条件,基于所述内容标签,生成所述对象兴趣标签节点数据。
[0036]可选地,所述第二生成单元具体用于:
[0037]基于所述第一子空间中的所述内容节点数据,在所述多场景要素互联图谱中,生成所述内容节点、以及所述对象要素节点与所述内容节点的关系;
[0038]基于所述第二子空间中的所述内容作者节点数据,在所述多场景要素互联图谱中,生成所述内容作者节点、以及所述对象要素节点与所述内容作者节点的关系;
[0039]基于所述第三子空间中的所述推荐活动节点数据,在所述多场景要素互联图谱中,生成所述推荐活动节点、以及所述对象要素节点与所述推荐活动节点的关系;
[0040]基于所述第四子空间中的所述对象兴趣标签节点数据,在所述多场景要素互联图谱中,生成所述对象兴趣标签节点、以及所述对象要素节点与所述对象兴趣标签节点的关系。
[0041]可选地,所述任务是内容推荐;所述任务预测单元具体用于:
[0042]利用所述图神经网络,将所述内容节点对应的所述子图编码为所述子图对应的多场景要素关系向量;
[0043]将所述多场景要素关系向量和目标对象输入内容推荐模型,得到为所述目标对象推荐的目标内容。
[0044]可选地,所述任务是内容推荐;所述任务预测单元具体用于:
[0045]将各个所述子图编码成的所述多场景要素关系向量级联,得到级联向量;
[0046]将所述级联向量和目标对象输入内容推荐模型,得到为所述目标对象推荐的目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取多个场景中的对象关系数据、和各个所述对象的对象动作关联数据;基于多个所述场景中的所述对象关系数据,生成多场景要素互联图谱中的对象要素节点、和所述对象要素节点之间的关系,其中,所述多场景要素互联图谱具有多个要素节点,多个所述要素节点包括所述对象要素节点和辅助要素节点;基于多个所述场景中的各个所述对象的对象动作关联数据,在所述多场景要素互联图谱中,生成所述辅助要素节点、以及所述对象要素节点与所述辅助要素节点的关系;从所述多场景要素互联图谱中,提取每种类型的所述要素节点对应的子图;利用图神经网络,将所述子图编码为所述子图对应的多场景要素关系向量,用于所述子图对应的任务预测。2.根据权利要求1所述的数据处理方法,其特征在于,所述基于多个所述场景中的各个所述对象的对象动作关联数据,在所述多场景要素互联图谱中,生成所述辅助要素节点、以及所述对象要素节点与所述辅助要素节点的关系,包括:建立所述辅助要素节点的各个类型对应的子空间;基于多个所述场景中的各个所述对象的对象动作关联数据,获取各个所述类型的辅助要素节点数据,放入所述类型对应的所述子空间中;基于每个所述子空间中的所述辅助要素节点数据,在所述多场景要素互联图谱中,生成所述辅助要素节点、以及所述对象要素节点与所述辅助要素节点的关系。3.根据权利要求2所述的数据处理方法,其特征在于,所述对象动作关联数据包括施动对象信息、受动体信息、和动作信息;所述基于多个所述场景中的各个所述对象的对象动作关联数据,获取各个所述类型的辅助要素节点数据,放入所述类型对应的所述子空间中,包括:将所述受动体信息作为所述辅助要素节点数据的数据体,将所述施动对象信息和所述动作信息作为所述辅助要素节点数据的属性,放入所述类型对应的所述子空间中;所述基于每个所述子空间中的所述辅助要素节点数据,在所述多场景要素互联图谱中,生成所述辅助要素节点、以及所述对象要素节点与所述辅助要素节点的关系,包括:基于所述数据体,在所述多场景要素互联图谱中,生成所述辅助要素节点,且基于所述属性,在所述多场景要素互联图谱中,生成所述对象要素节点与所述辅助要素节点的关系;所述从所述多场景要素互联图谱中,提取每种类型的所述要素节点对应的子图,包括:从所述多场景要素互联图谱中,提取对象要素节点和每种类型的所述要素节点,并提取所述对象要素节点与所述辅助要素节点的关系,以构成所述子图。4.根据权利要求2所述的数据处理方法,其特征在于,所述对象动作关联数据包括:所述对象与内容的第一交互数据、所述对象与内容作者的第二交互数据、所述对象与推荐活动项的第三交互数据;所述辅助要素节点数据包括:对象兴趣标签节点数据、内容节点数据、内容作者节点数据、和推荐活动节点数据;所述基于多个所述场景中的各个所述对象的对象动作关联数据,获取各个所述类型的辅助要素节点数据,放入所述类型对应的所述子空间中,包括:基于所述第一交互数据,生成所述内容节点数据,放入所述内容节点数据对应的第一子空间中;
基于所述第二交互数据,生成所述内容作者节点数据,放入所述内容作者节点数据对应的第二子空间中;基于所述第三交互数据,生成所述推荐活动节点数据,放入所述推荐活动节点数据对应的第三子空间中;基于对象与各个所述内容的所述第一交互数据,生成所述对象兴趣标签节点数据,放入所述对象兴趣标签节点数据对应的第四子空间中。5.根据权利要求4所述的数据处理方法,其特征在于,所述基于每个所述子空间中的所述辅助要素节点数据,在所述多场景要素互联图谱中,生成所述辅助要素节点、以及所述对象要素节点与所述辅助要素节点的关系,包括:基于所述第一子空间中的所述内容节点数据,在所述多场景要素互联图谱中,生成所述内容节点、以及所述对象要素节点与所述内容节点的关系;基于所述第二子空间中的所述内容作者节点数据,在所述多场景要素互联图谱中,生成所述内容作者节点、以及所述对象要素节点与所述内容作者节点的关系;基于所述第三子空间中的所述推荐活动节点数据,在所述多场景要素互联图谱中,生成所述推荐活动节点、以及所述对象要素节点与所述推荐活动节点的关系;基于所述第四子空间中的所述对象兴趣标签节点数据,在所述多场景要素互联图谱中,生成所述对象兴趣标签节点、以及所述对象要素节点与所述对象兴趣标签节点的关系。6.根据权利要求5所述的数据处理方法,其特征在于,所述任务是内容推荐;所述利用图神经网络,将所述子图编码为所述子图对应的多场景要素关系向量,用于所述子图对应的任务预测,包括:利用所述图神经网络,将所述内容节点对应的所述子图编码为所述子图对应的多场景要素关系向量;将所述多场景要素关系向量和目标对象输入内容推荐模型,得到为所述目标对象推荐的目标内容。7.根据权利要求5所述的数...

【专利技术属性】
技术研发人员:刘刚
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1