数据处理方法、设备及可读存储介质技术

技术编号:33131388 阅读:11 留言:0更新日期:2022-04-17 00:48
本申请公开了一种数据处理方法、设备及可读存储介质,该方法包括:获取第一样本对象针对每个第一样本媒体数据分别对应的通用属性特征以及第一未来属性特征,在初始判别器中根据通用属性特征以及第一未来属性特征,输出第一样本对象针对每个第一样本媒体数据的第一触发概率,在初始判别器中输出针对由初始生成器所提供的候选样本媒体数据的第二触发概率;根据第一触发概率和第二触发概率,调整初始对抗网络的模型参数,得到目标对抗网络。采用本申请,可以减少概率预测模型的运行时间以及提高推荐的候选媒体数据质量。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。种场景。种场景。

【技术实现步骤摘要】
数据处理方法、设备及可读存储介质


[0001]本申请涉及互联网
,尤其涉及一种数据处理方法、设备及可读存储介质。

技术介绍

[0002]随着数字化时代的来临,阅读对象对于阅读内容的关联推荐效果有着越来越高的要求标准。关联推荐应用于数据库、多媒体数据观看、出行路线分析等场景,是人工智能模型以及计算机深度学习中的常见操作。常用的关联推荐模型包括基于协同过滤以及逻辑回归等传统方法的推荐算法、利用深度学习排序算法以及强化学习算法的推荐算法和掩码语言模型(MLM,Masked Language Model)。
[0003]当前常用的关联推荐模型,具有广泛的涵盖面,可以提供多类型目标媒体数据的关联推荐媒体数据,目前通常都是基于一些热点内容进行媒体数据的关联推荐,这样就会导致所推荐的媒体数据的类型过于单一,降低了推荐质量。

技术实现思路

[0004]本申请实施例提供一种数据处理方法、设备及可读存储介质,可以丰富所推荐的媒体数据的类型,提高推荐质量。
[0005]本申请实施例一方面提供了一种数据处理方法,包括:
[0006]根据第一样本对象相关联的第一历史触发属性信息以及至少两个第一样本媒体数据分别对应的媒体属性信息,确定第一样本对象针对每个第一样本媒体数据分别对应的通用属性特征;
[0007]获取第一样本对象在未来时刻下,与第一历史触发属性信息相关联的第一未来属性特征;
[0008]通过初始对抗网络中的初始生成器在至少两个第二样本媒体数据中筛选出候选样本媒体数据,初始生成器将候选样本媒体数据发送至初始对抗网络中的初始判别器;
[0009]在初始判别器中,根据第一样本对象针对每个第一样本媒体数据分别对应的通用属性特征以及第一未来属性特征,输出第一样本对象针对每个第一样本媒体数据的第一触发概率,在初始判别器中输出针对候选样本媒体数据的第二触发概率;
[0010]根据第一触发概率和第二触发概率,调整初始对抗网络的模型参数,得到目标对抗网络,将目标对抗网络中的目标生成器,确定为用于预测目标对象针对媒体数据的触发概率的概率预测模型。
[0011]进一步地,至少两个第一样本媒体数据包括第一样本媒体数据S
i
,i为正整数;
[0012]方法还包括:
[0013]将第一样本对象的对象属性信息、第一样本对象的触发记录信息以及历史触发第一样本媒体数据的分发环境信息,确定为第一样本对象相关联的第一历史触发属性信息;历史触发第一样本媒体数据为触发记录信息中所记录的第一样本媒体数据;
[0014]将第一样本媒体数据S
i
的媒体数据标签、媒体数据内容类别以及媒体数据场景类
别,确定为第一样本媒体数据S
i
对应的媒体属性信息。
[0015]进一步地,通过初始对抗网络中的初始生成器在至少两个第二样本媒体数据中筛选出候选样本媒体数据,包括:
[0016]根据第二样本对象相关联的第二历史触发属性信息以及至少两个第二样本媒体数据分别对应的媒体属性信息,确定第二样本对象针对每个第二样本媒体数据分别对应的通用属性特征;
[0017]将第二样本对象针对每个第二样本媒体数据分别对应的通用属性特征,输入初始对抗网络中的初始生成器,通过初始生成器生成第二样本对象针对每个第二样本媒体数据分别对应的第一生成触发概率;
[0018]根据第二历史触发属性信息,从至少两个第二样本媒体数据中筛选出S个匹配样本;S个匹配样本为第二样本对象未触发过的第二样本媒体数据;S为正整数;
[0019]根据第一生成触发概率对S个匹配样本进行排序,得到排序后的S个匹配样本,从排序后的S个匹配样本中获取K个匹配样本,作为候选样本媒体数据;K为小于或等于S的正整数。
[0020]进一步地,初始判别器包括特征卷积层、神经网络感知层与全连接激活层;
[0021]在初始判别器中,根据第一样本对象针对候选样本媒体数据对应的通用属性特征以及第一未来属性特征,输出第一样本对象针对第一样本媒体数据的第一触发概率,包括:
[0022]通过特征卷积层对第一样本对象针对第一样本媒体数据对应的通用属性特征以及第一未来属性特征进行卷积融合处理,得到第一样本卷积融合特征,将第一样本卷积融合特征输入神经网络感知层;
[0023]通过神经网络感知层对第一样本卷积融合特征进行加权转换处理,得到第一样本卷积融合特征对应的待激活特征,将待激活特征输入全连接激活层;
[0024]通过全连接激活层对待激活特征进行激活处理,得到第一样本对象针对第一样本媒体数据的第一触发概率。
[0025]进一步地,在初始判别器中输出针对候选样本媒体数据的第二触发概率,包括:
[0026]获取第二样本对象在未来时刻下,与第二历史触发属性信息相关联的第二未来属性特征;
[0027]在初始判别器中,根据第二样本对象针对候选样本媒体数据对应的通用属性特征以及第二未来属性特征,输出第二样本对象针对候选样本媒体数据的第二触发概率。
[0028]进一步地,根据第一触发概率和第二触发概率,调整初始对抗网络的模型参数,得到目标对抗网络,包括:
[0029]根据第一触发概率以及针对第一样本媒体数据的真实触发标签,确定针对第一样本媒体数据的第一损失值;
[0030]根据第二触发概率确定针对候选样本媒体数据的第二损失值;
[0031]根据对抗判别损失函数、第一损失值以及第二损失值,对初始判别器的模型参数进行调整;
[0032]根据对抗生成损失函数、第一损失值以及第二损失值,对初始生成器的模型参数进行调整;
[0033]根据调整后的初始判别器以及调整后的初始生成器,生成目标对抗网络。
[0034]进一步地,根据调整后的初始判别器以及调整后的初始生成器,生成目标对抗网络,包括:
[0035]根据第二样本对象相关联的第二历史触发属性信息以及至少两个第二样本媒体数据分别对应的媒体属性信息,确定第二样本对象针对每个第二样本媒体数据分别对应的通用属性特征;
[0036]将第二样本对象针对每个第二样本媒体数据分别对应的通用属性特征,输入初始生成器,通过初始生成器生成第二样本对象针对每个第二样本媒体数据分别对应的第一生成触发概率;
[0037]根据第一生成触发概率以及针对第二样本媒体数据的真实触发标签,确定针对第二样本媒体数据的第三损失值;
[0038]根据监督损失函数以及第三损失值,对调整后的初始生成器的模型参数进行调整,得到目标生成器,将目标生成器和调整后的初始判别器确定为目标对抗网络。
[0039]进一步地,根据调整后的初始判别器以及调整后的初始生成器,生成目标对抗网络,包括:
[0040]将第一样本对象针对每个第一样本媒体数据分别对应的通用属性特征,输入初始生成器,通过初始生成器生成第一样本对象针对每个第一样本媒体数据分别对应的第二生成触发概率;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:根据第一样本对象相关联的第一历史触发属性信息以及至少两个第一样本媒体数据分别对应的媒体属性信息,确定所述第一样本对象针对每个第一样本媒体数据分别对应的通用属性特征;获取所述第一样本对象在未来时刻下,与所述第一历史触发属性信息相关联的第一未来属性特征;通过初始对抗网络中的初始生成器在至少两个第二样本媒体数据中筛选出候选样本媒体数据,所述初始生成器将所述候选样本媒体数据发送至所述初始对抗网络中的初始判别器;在所述初始判别器中,根据所述第一样本对象针对每个第一样本媒体数据分别对应的通用属性特征以及所述第一未来属性特征,输出所述第一样本对象针对每个第一样本媒体数据的第一触发概率,在所述初始判别器中输出针对所述候选样本媒体数据的第二触发概率;根据所述第一触发概率和所述第二触发概率,调整所述初始对抗网络的模型参数,得到目标对抗网络,将所述目标对抗网络中的目标生成器,确定为用于预测目标对象针对媒体数据的触发概率的概率预测模型。2.根据权利要求1所述的方法,其特征在于,所述至少两个第一样本媒体数据包括第一样本媒体数据Si,i为正整数;所述方法还包括:将所述第一样本对象的对象属性信息、所述第一样本对象的触发记录信息以及历史触发第一样本媒体数据的分发环境信息,确定为所述第一样本对象相关联的第一历史触发属性信息;所述历史触发第一样本媒体数据为所述触发记录信息中所记录的第一样本媒体数据;将所述第一样本媒体数据Si的媒体数据标签、媒体数据内容类别以及媒体数据场景类别,确定为所述第一样本媒体数据Si对应的媒体属性信息。3.根据权利要求1所述的方法,其特征在于,所述通过初始对抗网络中的初始生成器在至少两个第二样本媒体数据中筛选出候选样本媒体数据,包括:根据第二样本对象相关联的第二历史触发属性信息以及至少两个第二样本媒体数据分别对应的媒体属性信息,确定所述第二样本对象针对每个第二样本媒体数据分别对应的通用属性特征;将所述第二样本对象针对每个第二样本媒体数据分别对应的通用属性特征,输入所述初始对抗网络中的初始生成器,通过所述初始生成器生成所述第二样本对象针对所述每个第二样本媒体数据分别对应的第一生成触发概率;根据所述第二历史触发属性信息,从所述至少两个第二样本媒体数据中筛选出S个匹配样本;所述S个匹配样本为所述第二样本对象未触发过的第二样本媒体数据;S为正整数;根据所述第一生成触发概率对所述S个匹配样本进行排序,得到排序后的S个匹配样本,从所述排序后的S个匹配样本中获取K个匹配样本,作为候选样本媒体数据;所述K为小于或等于S的正整数。4.根据权利要求1所述的方法,其特征在于,所述初始判别器包括特征卷积层、神经网络感知层与全连接激活层;
所述在所述初始判别器中,根据所述第一样本对象针对所述候选样本媒体数据对应的通用属性特征以及所述第一未来属性特征,输出所述第一样本对象针对所述第一样本媒体数据的第一触发概率,包括:通过所述特征卷积层对所述第一样本对象针对所述第一样本媒体数据对应的通用属性特征以及所述第一未来属性特征进行卷积融合处理,得到第一样本卷积融合特征,将所述第一样本卷积融合特征输入所述神经网络感知层;通过所述神经网络感知层对所述第一样本卷积融合特征进行加权转换处理,得到所述第一样本卷积融合特征对应的待激活特征,将所述待激活特征输入所述全连接激活层;通过所述全连接激活层对所述待激活特征进行激活处理,得到所述第一样本对象针对所述第一样本媒体数据的第一触发概率。5.根据权利要求3所述的方法,其特征在于,所述在所述初始判别器中输出针对所述候选样本媒体数据的第二...

【专利技术属性】
技术研发人员:张绍亮谢若冰王瑞杨智鸿夏锋林乐宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1