数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:39251812 阅读:8 留言:0更新日期:2023-10-30 12:03
本申请属于人工智能技术领域,具体涉及一种数据处理方法、装置、设备及存储介质。所述方法包括:将至少两个初始特征域输入至初始对象推荐模型进行处理,得到预设数量个初始特征域对和预测交互信息;基于预测交互信息和样本交互信息对初始对象推荐模型进行模型训练,得到目标对象推荐模型;基于目标对象推荐模型的模型参数,确定每个初始特征域对所对应的目标交叉权重数据;基于每个初始特征域对所对应的目标交叉权重数据,对至少两个初始特征域进行调整,得到目标特征域。通过基于目标交叉权重数据对初始特征域进行调整得到目标特征域,实现了基于推荐效果来确定特征域划分依据,从而避免了特征域内的特征损耗,实现了对推荐效果的准确预测。准确预测。准确预测。

【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质


[0001]本申请属于人工智能
,具体涉及一种数据处理方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网技术的不断发展,为了使人们能够更方便地获取感兴趣的网络信息,互联网平台可能会基于推荐系统向目标账号进行对象推荐,比如向目标账号推荐文章、视频、音乐、图片、商品、广告等等。
[0003]推荐系统在向目标账号推荐某个对象之前,通常会基于对象推荐模型进行推荐效果预测。在进行推荐效果预测时,对象推荐模型通过将多种不同类型、不同维度的对象特征以及账号特征进行交叉组合,然后预测待推荐对象的推荐效果。对象推荐模型在对特征进行交叉组合时,需要先对输入的特征进行特征域划分。目前,特征域的划分方式通常仅仅是按照对象特征和账号特征进行粗略划分,并没有对特征与进行进一步的细化。这样的特征域划分方式并没有考虑到不同特征对推荐效果影响,而且也无法提供更细粒度的特征域划分依据。此外,基于上述特征域划分方式,同一特征域内的特征可能会对推荐效果起到互斥作用,从而导致特征损耗,无法对推荐效果进行准确预测。

技术实现思路

[0004]为了解决上述技术问题,本申请提供一种数据处理方法、装置、设备及存储介质。通过采用模型训练的方式得到每个初始特征域与其他初始特征域之间的目标交叉权重数据,然后基于目标交叉权重数据对初始特征域进行调整得到目标特征域,实现了基于推荐效果来确定特征域划分依据,从而避免了特征域内的特征损耗,进而实现了对推荐效果的准确预测。
[0005]一方面,本申请提出了一种数据处理方法,所述方法包括:
[0006]获取初始对象推荐模型、样本交互信息和至少两个初始特征域;每个初始特征域中包括至少一个样本特征数据;样本特征数据为样本推荐对象特征数据或样本账号特征数据;样本推荐对象特征数据为样本推荐对象对应的特征数据;样本账号特征数据为样本账号对应的特征数据;样本账号为接收样本推荐对象的账号;样本交互信息为样本账号与样本推荐对象之间的交互信息;
[0007]将至少两个初始特征域输入至初始对象推荐模型进行组合处理,得到预设数量个初始特征域对;以及基于每个初始特征域对,对样本账号和样本推荐对象之间的交互信息进行预测处理,得到预测交互信息;
[0008]基于预测交互信息和样本交互信息对初始对象推荐模型进行模型训练,直至初始对象推荐模型输出的预测交互信息与样本交互信息之间的差异满足预设条件,得到目标对象推荐模型;
[0009]基于目标对象推荐模型的模型参数,确定每个初始特征域对所对应的目标交叉权
重数据;目标交叉权重数据用于表征初始特征域对中的初始特征域进行特征交叉的交叉权重;
[0010]基于每个初始特征域对所对应的目标交叉权重数据,对至少两个初始特征域进行调整,得到目标特征域。
[0011]另一方面,本申请实施例提供了一种数据处理装置,所述装置包括:
[0012]获取模块,用于获取初始对象推荐模型、样本交互信息和至少两个初始特征域;每个初始特征域中包括至少一个样本特征数据;样本特征数据为样本推荐对象特征数据或样本账号特征数据;样本推荐对象特征数据为样本推荐对象对应的特征数据;样本账号特征数据为样本账号对应的特征数据;样本账号为接收样本推荐对象的账号;样本交互信息为样本账号与样本推荐对象之间的交互信息;
[0013]处理模块,用于将至少两个初始特征域输入至初始对象推荐模型进行组合处理,得到预设数量个初始特征域对;以及基于每个初始特征域对,对样本账号和样本推荐对象之间的交互信息进行预测处理,得到预测交互信息;
[0014]模型训练模块,用于基于预测交互信息和样本交互信息对初始对象推荐模型进行模型训练,直至初始对象推荐模型输出的预测交互信息与样本交互信息之间的差异满足预设条件,得到目标对象推荐模型;
[0015]目标交叉权重数据确定模块,用于基于目标对象推荐模型的模型参数,确定每个初始特征域对所对应的目标交叉权重数据;目标交叉权重数据用于表征初始特征域对中的初始特征域进行特征交叉的交叉权重;
[0016]特征域调整模块,用于基于每个初始特征域对所对应的目标交叉权重数据,对至少两个初始特征域进行调整,得到目标特征域。
[0017]另一方面,本申请提出了一种数据处理的电子设备,所述电子设备包括处理器和存储器,存储器中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现如上述所述的数据处理方法。
[0018]另一方面,本申请提出了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述所述的数据处理方法。
[0019]另一方面,本申请提出了一种计算机程序产品,所述计算机程被处理器执行时实现如上述所述的数据处理方法。
[0020]本申请实施例提出的数据处理方法、装置、电子设备及存储介质,基于初始特征域,通过初始对象推荐模型对样本推荐对象的推荐效果进行预测,并利用样本交互数据对初始对象推荐模型进行模型训练,从而得到目标对象推荐模型。然后基于目标对象推荐模型的模型参数,来确定每个初始特征域与其他初始特征域之间的目标交叉权重数据。然后将目标交叉权重数据作为特征域调整依据,来对初始划分得到的初始特征域进行调整,从而得到目标特征域,实现了特征域的准确划分。该方案基于推荐效果来确定特征域划分依据,从而避免了特征域内的特征损耗,进而提升了对推荐效果预测的准确度。
[0021]为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,
还可以根据这些附图获得其它附图。
[0022]图1是根据一示例性实施例示出的一种交互信息预测方法的实施环境示意图。
[0023]图2是根据一示例性实施例示出的一种数据处理方法的流程示意图。
[0024]图3是根据一示例性实施例示出的一种初始对象推荐模型的结构示意图。
[0025]图4是根据一示例性实施例示出的另一种初始对象推荐模型的结构示意图。
[0026]图5是根据一示例性实施例示出的一种数据处理装置框图。
[0027]图6是根据一示例性实施例提供的一种数据处理方法的服务器的硬件结构框图。
具体实施方式
[0028]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0029]需要说明的是,本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取初始对象推荐模型、样本交互信息和至少两个初始特征域;每个所述初始特征域中包括至少一个样本特征数据;所述样本特征数据为样本推荐对象特征数据或样本账号特征数据;所述样本推荐对象特征数据为样本推荐对象对应的特征数据;所述样本账号特征数据为样本账号对应的特征数据;所述样本账号为接收所述样本推荐对象的账号;所述样本交互信息为所述样本账号与所述样本推荐对象之间的交互信息;将至少两个所述初始特征域输入至所述初始对象推荐模型进行组合处理,得到预设数量个初始特征域对;以及基于每个所述初始特征域对,对所述样本账号和所述样本推荐对象之间的交互信息进行预测处理,得到预测交互信息;基于所述预测交互信息和所述样本交互信息对所述初始对象推荐模型进行模型训练,直至所述初始对象推荐模型输出的预测交互信息与所述样本交互信息之间的差异满足预设条件,得到目标对象推荐模型;基于所述目标对象推荐模型的模型参数,确定每个所述初始特征域对所对应的目标交叉权重数据;所述目标交叉权重数据用于表征所述初始特征域对中的初始特征域进行特征交叉的交叉权重;基于每个所述初始特征域对所对应的目标交叉权重数据,对至少两个所述初始特征域进行调整,得到目标特征域。2.根据权利要求1所述的方法,其特征在于,在所述获取初始对象推荐模型、样本交互信息和至少两个初始特征域之前,所述方法还包括:获取样本推荐对象特征集和样本账号特征集;所述样本推荐对象特征集包括至少一个所述样本推荐对象特征数据;所述样本账号特征集包括至少一个所述样本账号特征数据;基于所述样本推荐对象特征数据和所述样本账号特征数据,生成至少两个所述初始特征域;至少两个所述初始特征域用于输入至所述初始对象推荐模型进行组合处理,得到预设数量个所述初始特征域对。3.根据权利要求2所述的方法,其特征在于,所述基于所述样本推荐对象特征数据和所述样本账号特征数据,生成至少两个所述初始特征域,包括:基于所述样本推荐对象特征数据,生成样本推荐对象特征域;基于所述样本账号特征数据,生成预设数量个样本账号特征域;基于所述样本推荐对象特征域和预设数量个所述样本账号特征域,得到至少两个所述初始特征域。4.根据权利要求2所述的方法,其特征在于,所述基于所述样本推荐对象特征数据和所述样本账号特征数据,生成至少两个所述初始特征域,包括:基于所述样本账号特征数据,生成样本账号特征域;基于所述样本推荐对象特征数据,生成预设数量个样本推荐对象特征域;基于所述样本账号特征域和预设数量个所述样本推荐对象特征域,得到至少两个所述初始特征域。5.根据权利要求3所述的方法,其特征在于,所述初始特征域对为第一初始特征域对;所述预测交互信息为第一预测交互信息;所述初始对象推荐模型包括第一初始特征处理子模型和第一初始推荐预测子模型;所述基于每个所述初始特征域对,对所述样本账号和所
述样本推荐对象之间的交互信息进行预测处理,得到预测交互信息,包括:将所述样本推荐对象特征域中的特征数据和每个所述样本账号特征域中的特征数据分别输入所述第一初始特征处理子模型,以对所述样本推荐对象特征域中的特征数据进行特征嵌入处理,得到所述样本推荐对象特征域对应的特征向量;以及对每个所述样本账号特征域中的特征数据进行特征嵌入处理,得到每个所述样本账号特征域对应的特征向量;以及确定每个所述第一初始特征域对所对应的第一初始交叉权重数据;以及对所对应的特征向量和每个所述第一初始特征域对所述对应的第一初始交叉权重数据,确定第一初始交叉特征;将所述第一初始交叉特征输入所述第一初始推荐预测子模型,以对所述样本账号和所述样本推荐对象之间的交互信息进行预测,得到所述第一预测交互信息。6.根据权利要求5所述的方法,其特征在于,所述目标交叉权重数据为第一目标交叉权重数据;所述第一目标交叉权重数据用于表征每个所述第一初始特征域对中的样本推荐对象特征域与样本账号特征域的交叉权重;所述基于每个所述初始特征域对所对应的目标交叉权重数据,对至少两个所述初始特征域进行调整,得到目标特征域,包括:将预设数量个所述第一初始特征域对中的任意两个第一初始特征域对,确定为第一特征域组合;基于所述第一特征域组合中每个第一初始特征域对所对应的第一目标交叉权重数据,确定所述第一特征域组合的交叉权重变化数据;在所述交叉权重变...

【专利技术属性】
技术研发人员:邓慧挺刘大鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1