一种数据处理方法、相关设备及计算机可读存储介质技术

技术编号:28978976 阅读:18 留言:0更新日期:2021-06-23 09:25
本发明专利技术实施例提供了一种数据处理方法、相关设备及计算机可读存储介质,其中方法包括:获取多个用户中每个用户的特征表示数据,通过调用信息聚合模型对该多个用户的特征表示数据在多个用户分类上进行处理,实现对用户信息的分类聚合,并得到每个用户的特征描述向量,特征描述向量包括每个用户的邻居用户的特征表示数据在每个用户分类上的聚合结果,基于该多个用户的特征描述向量确定任一用户的待推荐用户,通过对用户特征进行分类聚合使得用户描述向量的信息维度更加丰富,可以提升用户描述向量的准确度,进而提升好友推荐的准确度和成功率。

【技术实现步骤摘要】
一种数据处理方法、相关设备及计算机可读存储介质
本专利技术涉及计算机
,尤其涉及一种数据处理方法、相关设备及计算机可读存储介质。
技术介绍
随着互联网技术的快速发展,人们之间的交往愈加密切。除了专注于沟通交流的社交软件,游戏软件、音视频软件等越来越多的应用开始提供交友功能,以满足现代社会各年龄人士解决社交问题的刚需。与此同时,软件推荐的好友候选列表的准确率,以及匹配的成功率成为影响交友软件用户体验的主要方面。目前,大多是基于地理位置、用户画像等维度的信息获取可能匹配的好友,并推荐给用户,然而地理位置对匹配结果的影响过于严重,并且需要依赖用户主动进行筛选,匹配成功率较低;用户画像的信息量仍然不够丰富,推荐好友的准确度也不理想,难以达到用户的预期。可见,如何提升好友推荐的准确度和成功率已成为亟待解决的问题。
技术实现思路
本专利技术实施例提供一种数据处理方法、相关设备及计算机可读存储介质,通过对用户特征进行分类聚合可以提升用户描述向量的准确度,进而提升好友推荐的准确度和成功率。第一方面,本专利技术实施例提供了一种数据处理方法,所述方法包括:获取多个用户中每个用户的特征表示数据。调用信息聚合模型对所述多个用户的特征表示数据在多个用户分类上进行处理,以得到所述每个用户的特征描述向量,所述特征描述向量包括所述每个用户的邻居用户的特征表示数据在每个用户分类上的聚合结果。基于所述多个用户的特征描述向量确定目标用户的待推荐用户,所述目标用户为所述多个用户中的任意一个。第二方面,本专利技术实施例提供了一种数据处理装置,所述装置包括:获取模块,用于获取多个用户中每个用户的特征表示数据。处理模块,用于调用信息聚合模型对所述多个用户的特征表示数据在多个用户分类上进行处理,以得到所述每个用户的特征描述向量,所述特征描述向量包括所述每个用户的邻居用户的特征表示数据在每个用户分类上的聚合结果。确定模块,用于基于所述多个用户的特征描述向量确定目标用户的待推荐用户,所述目标用户为所述多个用户中的任意一个。可选的,所述处理模块,具体用于:利用信息聚合模型中每个用户分类对应的聚合方法对所述每个用户的特征表示数据进行处理,得到所述每个用户在所述每个用户分类的表示向量。根据所述每个用户在所述每个用户分类的表示向量以及图网络中对应的邻居用户属于所述每个用户分类的概率,获取所述邻居用户的特征表示数据在所述每个用户分类上的第一聚合结果。根据所述第一聚合结果获取所述每个用户的特征描述向量。可选的,所述处理模块,具体用于:根据所述第一聚合结果以及所述邻居用户在所述每个用户分类的表示向量,调整所述邻居用户属于所述每个用户分类的概率。根据所述每个用户在所述每个用户分类的表示向量以及调整后的属于所述每个用户分类的概率,获取所述邻居用户的特征表示数据在所述每个用户分类上的第二聚合结果。根据所述第二聚合结果获取所述每个用户的特征描述向量。可选的,所述处理模块,具体用于:针对所述多个用户中的任一用户以及所述多个用户分类中的任一用户分类,获取所述任一用户在图网络中的邻居用户。根据所述任一用户和所述邻居用户在所述任一用户分类的表示向量以及所述邻居用户属于所述每个用户分类的概率,获取所述邻居用户的特征表示数据在所述任一用户分类上的第一聚合结果。可选的,所述处理模块,具体用于:调用信息聚合模型对所述多个用户的特征表示数据在多个用户分类上进行处理,以得到所述每个用户的中间描述向量。调用所述信息聚合模型对所述多个用户的中间描述向量在所述多个用户分类上进行处理,以得到所述每个用户的特征描述向量。可选的,所述获取模块,具体用于:获取图网络包括的多个用户的关系描述数据,所述关系描述数据用于表示所述多个用户中任意两个用户之间的亲密度。利用词向量嵌入方法对所述关系描述数据进行处理,得到所述多个用户中每个用户的特征表示数据。可选的,所述获取模块,具体用于:利用词向量嵌入方法对所述关系描述数据进行处理,得到所述多个用户中每个用户的嵌入向量。根据所述每个用户的嵌入向量、用户画像以及辅助信息确定所述每个用户的特征表示数据。可选的,所述获取模块,具体用于:获取图网络包括的多个用户中任意两个用户之间的交互特征数据。根据所述交互特征数据确定所述任意两个用户之间的亲密度,并根据所述任意两个用户之间的亲密度建立关系描述矩阵。将所述关系描述矩阵作为所述图网络包括的多个用户的关系描述数据。可选的,所述获取模块,具体用于:根据所述关系描述数据分别以所述多个用户中的每个用户为起点,在所述图网络中进行随机游走,得到多条游走路径。利用词向量嵌入方法对所述多条游走路径包括的用户的标识进行处理,得到所述每个用户的嵌入向量。可选的,所述装置还包括训练模块,其中:所述获取模块,还用于获取训练样本集,所述训练样本集包括存在联系的用户对以及不存在联系的用户对。所述训练模块,用于利用所述训练样本集对图卷积神经网络和多层感知机神经网络进行训练,得到信息聚合模型以及特征匹配模型。可选的,所述训练模块,具体用于:利用图卷积神经网络和多层感知机神经网络对所述训练样本集进行处理,得到所述训练样本集的预测结果,所述图卷积神经网络包括多个用户分类中每个用户分类对应的聚合方法。根据所述训练样本集的真实结果和所述预测结果确定损失值。根据所述损失值对所述图卷积神经网络中每个用户分类对应的聚合方法进行调整,得到信息聚合模型。根据所述损失值对所述多层感知机神经网络的网络参数进行调整,得到特征匹配模型。可选的,所述确定模块,具体用于:调用特征匹配模型对所述多个用户的特征描述向量进行匹配处理,得到目标用户与所述多个用户中其他用户之间的匹配度。根据所述匹配度确定所述目标用户的待推荐用户。第三方面,本专利技术实施例提供了一种计算机设备,所述计算机设备包括处理器和存储装置,所述处理器和所述存储装置相互连接,其中,所述存储装置用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,用以执行第一方面所述的数据处理方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行,用以执行第一方面所述的数据处理方法。第五方面,本专利技术实施公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面所述的数据处理方法。本专利技术实施例中,可以获取多个用户中每个用户的特征表示数据,通过调用信息聚合模型对该多个用户的特征表示数据在多个用户分类上进行处本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取多个用户中每个用户的特征表示数据;/n调用信息聚合模型对所述多个用户的特征表示数据在多个用户分类上进行处理,以得到所述每个用户的特征描述向量,所述特征描述向量包括所述每个用户的邻居用户的特征表示数据在每个用户分类上的聚合结果;/n基于所述多个用户的特征描述向量确定目标用户的待推荐用户,所述目标用户为所述多个用户中的任意一个。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取多个用户中每个用户的特征表示数据;
调用信息聚合模型对所述多个用户的特征表示数据在多个用户分类上进行处理,以得到所述每个用户的特征描述向量,所述特征描述向量包括所述每个用户的邻居用户的特征表示数据在每个用户分类上的聚合结果;
基于所述多个用户的特征描述向量确定目标用户的待推荐用户,所述目标用户为所述多个用户中的任意一个。


2.根据权利要求1所述的方法,其特征在于,所述调用信息聚合模型对所述多个用户的特征表示数据在多个用户分类上进行处理,以得到所述每个用户的特征描述向量,包括:
利用信息聚合模型中每个用户分类对应的聚合方法对所述每个用户的特征表示数据进行处理,得到所述每个用户在所述每个用户分类的表示向量;
根据所述每个用户在所述每个用户分类的表示向量以及图网络中对应的邻居用户属于所述每个用户分类的概率,获取所述邻居用户的特征表示数据在所述每个用户分类上的第一聚合结果;
根据所述第一聚合结果获取所述每个用户的特征描述向量。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第一聚合结果获取所述每个用户的特征描述向量,包括:
根据所述第一聚合结果以及所述邻居用户在所述每个用户分类的表示向量,调整所述邻居用户属于所述每个用户分类的概率;
根据所述每个用户在所述每个用户分类的表示向量以及调整后的属于所述每个用户分类的概率,获取所述邻居用户的特征表示数据在所述每个用户分类上的第二聚合结果;
根据所述第二聚合结果获取所述每个用户的特征描述向量。


4.根据权利要求2或3所述的方法,其特征在于,所述根据所述每个用户在所述每个用户分类的表示向量以及图网络中对应的邻居用户属于所述每个用户分类的概率,获取所述邻居用户的特征表示数据在所述每个用户分类上的第一聚合结果,包括:
针对所述多个用户中的任一用户以及所述多个用户分类中的任一用户分类,获取所述任一用户在图网络中的邻居用户;
根据所述任一用户和所述邻居用户在所述任一用户分类的表示向量以及所述邻居用户属于所述每个用户分类的概率,获取所述邻居用户的特征表示数据在所述任一用户分类上的第一聚合结果。


5.根据权利要求1所述的方法,其特征在于,所述调用信息聚合模型对所述多个用户的特征表示数据在多个用户分类上进行处理,以得到所述每个用户的特征描述向量,包括:
调用信息聚合模型对所述多个用户的特征表示数据在多个用户分类上进行处理,以得到所述每个用户的中间描述向量;
调用所述信息聚合模型对所述多个用户的中间描述向量在所述多个用户分类上进行处理,以得到所述每个用户的特征描述向量。


6.根据权利要求1所述的方法,其特征在于,所述获取多个用户中每个用户的特征表示数据,包括:
获取图网络包括的多个用户的关系描述数据,所述关系描述数据用于表示所述多个用户中任意两个用户之间的亲密度;
利用词向量嵌入方法对所述关系描述数据进行处理,得到所述多个用户中每个用户的特征表示数据。


7.根据权利要求6所述的方法,其特征在于,所述利用词向量嵌入方法对所述关系描述数据进行处理,得到所述多个用户中每个用户的特征表示数据,包括:
利用词向量嵌入方法对所述关系描述数据进行处理,得到所述多个用户中每个用户的嵌入向量;
根据所述每个用户的嵌入向...

【专利技术属性】
技术研发人员:陈昊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1