【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质
[0001]本申请属于人工智能
,具体涉及一种数据处理方法、装置、设备及存储介质。
技术介绍
[0002]随着互联网技术的不断发展,为了使人们能够更方便地获取感兴趣的网络信息,互联网平台可能会基于推荐系统向目标账号进行对象推荐,比如向目标账号推荐文章、视频、音乐、图片、商品、广告等等。
[0003]推荐系统在向目标账号推荐某个对象之前,通常会基于对象推荐模型进行推荐效果预测。在进行推荐效果预测时,对象推荐模型通过将多种不同类型、不同维度的对象特征以及账号特征进行交叉组合,然后预测待推荐对象的推荐效果。对象推荐模型在对特征进行交叉组合时,需要先对输入的特征进行特征域划分。目前,特征域的划分方式通常仅仅是按照对象特征和账号特征进行粗略划分,并没有对特征与进行进一步的细化。这样的特征域划分方式并没有考虑到不同特征对推荐效果影响,而且也无法提供更细粒度的特征域划分依据。此外,基于上述特征域划分方式,同一特征域内的特征可能会对推荐效果起到互斥作用,从而导致特征损耗,无法对推荐效果进行准确预测。
技术实现思路
[0004]为了解决上述技术问题,本申请提供一种数据处理方法、装置、设备及存储介质。通过采用模型训练的方式得到每个初始特征域与其他初始特征域之间的目标交叉权重数据,然后基于目标交叉权重数据对初始特征域进行调整得到目标特征域,实现了基于推荐效果来确定特征域划分依据,从而避免了特征域内的特征损耗,进而实现了对推荐效果的准确预测。
[0005]一方面,本申 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取初始对象推荐模型、样本交互信息和至少两个初始特征域;每个所述初始特征域中包括至少一个样本特征数据;所述样本特征数据为样本推荐对象特征数据或样本账号特征数据;所述样本推荐对象特征数据为样本推荐对象对应的特征数据;所述样本账号特征数据为样本账号对应的特征数据;所述样本账号为接收所述样本推荐对象的账号;所述样本交互信息为所述样本账号与所述样本推荐对象之间的交互信息;将至少两个所述初始特征域输入至所述初始对象推荐模型进行组合处理,得到预设数量个初始特征域对;以及基于每个所述初始特征域对,对所述样本账号和所述样本推荐对象之间的交互信息进行预测处理,得到预测交互信息;基于所述预测交互信息和所述样本交互信息对所述初始对象推荐模型进行模型训练,直至所述初始对象推荐模型输出的预测交互信息与所述样本交互信息之间的差异满足预设条件,得到目标对象推荐模型;基于所述目标对象推荐模型的模型参数,确定每个所述初始特征域对所对应的目标交叉权重数据;所述目标交叉权重数据用于表征所述初始特征域对中的初始特征域进行特征交叉的交叉权重;基于每个所述初始特征域对所对应的目标交叉权重数据,对至少两个所述初始特征域进行调整,得到目标特征域。2.根据权利要求1所述的方法,其特征在于,在所述获取初始对象推荐模型、样本交互信息和至少两个初始特征域之前,所述方法还包括:获取样本推荐对象特征集和样本账号特征集;所述样本推荐对象特征集包括至少一个所述样本推荐对象特征数据;所述样本账号特征集包括至少一个所述样本账号特征数据;基于所述样本推荐对象特征数据和所述样本账号特征数据,生成至少两个所述初始特征域;至少两个所述初始特征域用于输入至所述初始对象推荐模型进行组合处理,得到预设数量个所述初始特征域对。3.根据权利要求2所述的方法,其特征在于,所述基于所述样本推荐对象特征数据和所述样本账号特征数据,生成至少两个所述初始特征域,包括:基于所述样本推荐对象特征数据,生成样本推荐对象特征域;基于所述样本账号特征数据,生成预设数量个样本账号特征域;基于所述样本推荐对象特征域和预设数量个所述样本账号特征域,得到至少两个所述初始特征域。4.根据权利要求2所述的方法,其特征在于,所述基于所述样本推荐对象特征数据和所述样本账号特征数据,生成至少两个所述初始特征域,包括:基于所述样本账号特征数据,生成样本账号特征域;基于所述样本推荐对象特征数据,生成预设数量个样本推荐对象特征域;基于所述样本账号特征域和预设数量个所述样本推荐对象特征域,得到至少两个所述初始特征域。5.根据权利要求3所述的方法,其特征在于,所述初始特征域对为第一初始特征域对;所述预测交互信息为第一预测交互信息;所述初始对象推荐模型包括第一初始特征处理子模型和第一初始推荐预测子模型;所述基于每个所述初始特征域对,对所述样本账号和所
述样本推荐对象之间的交互信息进行预测处理,得到预测交互信息,包括:将所述样本推荐对象特征域中的特征数据和每个所述样本账号特征域中的特征数据分别输入所述第一初始特征处理子模型,以对所述样本推荐对象特征域中的特征数据进行特征嵌入处理,得到所述样本推荐对象特征域对应的特征向量;以及对每个所述样本账号特征域中的特征数据进行特征嵌入处理,得到每个所述样本账号特征域对应的特征向量;以及确定每个所述第一初始特征域对所对应的第一初始交叉权重数据;以及对所对应的特征向量和每个所述第一初始特征域对所述对应的第一初始交叉权重数据,确定第一初始交叉特征;将所述第一初始交叉特征输入所述第一初始推荐预测子模型,以对所述样本账号和所述样本推荐对象之间的交互信息进行预测,得到所述第一预测交互信息。6.根据权利要求5所述的方法,其特征在于,所述目标交叉权重数据为第一目标交叉权重数据;所述第一目标交叉权重数据用于表征每个所述第一初始特征域对中的样本推荐对象特征域与样本账号特征域的交叉权重;所述基于每个所述初始特征域对所对应的目标交叉权重数据,对至少两个所述初始特征域进行调整,得到目标特征域,包括:将预设数量个所述第一初始特征域对中的任意两个第一初始特征域对,确定为第一特征域组合;基于所述第一特征域组合中每个第一初始特征域对所对应的第一目标交叉权重数据,确定所述第一特征域组合的交叉权重变化数据;在所述交叉权重变...
【专利技术属性】
技术研发人员:邓慧挺,刘大鹏,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。