【技术实现步骤摘要】
一种数据处理方法、贡献值的获取方法以及相关设备
[0001]本申请涉及人工智能领域,尤其涉及一种数据处理方法
、
贡献值的获取方法以及相关设备
。
技术介绍
[0002]人工智能
(Artificial Intelligence
,
AI)
是利用数字计算机或者数字计算机控制的机器模拟
、
延伸和扩展人的智能,感知环境
、
获取知识并使用知识获得最佳结果的理论
、
方法
、
技术及应用系统
。
换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器
。
人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知
、
推理与决策的功能
。
[0003]将人工智能技术应用于推荐系统中是一种场景的应用方式,在推荐系统中,可以向用户多次展示同一对象,用户可能在该对象的某个展示行为中与该对象产生交互,为了能够对该对象的投放策略进行优化,可以利用机器学习模型来预测每个展示行为的转化率
(post
‑
click conversion rate
,
CVR)
,也即可以利用机器学习模型来预测每个展示行为对该对象被交互带来的贡献值
。
[0004]目前采用的一种方式包括:在获取到该对象的
n
个展示行 ...
【技术保护点】
【技术特征摘要】
1.
一种数据处理方法,其特征在于,所述方法包括:将第一训练样本输入第一机器学习模型,得到所述第一机器学习模型输出的第一信息,其中,所述第一训练样本指示至少一个第一展示行为,所述第一信息指示所述至少一个第一展示行为被交互的概率;通过第二机器学习模型对所述第一训练样本进行处理得到第二信息,所述第二信息指示所述至少一个第一展示行为中每个第一展示行为的贡献值之和,所述每个第一展示行为的贡献值代表所述每个第一展示行为对所述至少一个第一展示行为被交互做出的贡献;根据损失函数对所述第二机器学习模型进行训练,直至满足收敛条件,得到执行过训练操作的所述第二机器学习模型,其中,所述损失函数指示所述第一信息和所述第二信息之间的相似度,所述执行过训练操作的所述第二机器学习模型用于得到至少一个展示行为中每个展示行为的贡献值
。2.
根据权利要求1所述的方法,其特征在于,目标展示行为是所述至少一个第一展示行为中的任意一个,其中,所述目标展示行为的贡献值基于与所述目标展示行为对应的第一值和第二值得到,与所述目标展示行为对应的所述第一值代表所述目标展示行为自身的贡献值,与所述目标展示行为对应的所述第二值代表所述第一训练样本指示的至少一个第一展示行为中所述目标展示行为之外其他的第一展示行为对所述目标展示行为的贡献值的影响值
。3.
根据权利要求2所述的方法,其特征在于,所述第一训练样本包括所述第一展示行为的展示时间,其中,所述第一训练样本指示的至少一个第一展示行为中所述目标展示行为之外其他的第一展示行为对所述目标展示行为的贡献值与第一时间距离相关,所述第一时间距离为所述目标展示行为的展示时间与所述其他的第一展示行为的展示时间之间的距离
。4.
根据权利要求1至3任一项所述的方法,其特征在于,所述第一训练样本来源于训练数据集,所述训练数据集中存在第二训练样本,其中,所述第二训练样本基于第三训练样本得到,所述第三训练样本包括至少一个第二展示行为的展示时间,对所述第三训练样本中的至少一个展示时间进行更新得到所述第二训练样本
。5.
根据权利要求1至3任一项所述的方法,其特征在于,所述执行过训练操作的所述第二机器学习模型中参数的值用于得到至少一个展示行为中每个展示行为的贡献值
。6.
根据权利要求1至3任一项所述的方法,其特征在于,所述第一机器学习模型为预先训练过的,所述第一机器学习模型为如下任一种:循环神经网络
、
卷积神经网络
、
全连接神经网络或者注意力基于注意力机制的神经网络
。7.
根据权利要求1至3任一项所述的方法,其特征在于,所述至少一个第一展示行为被交互的概率为如下任一种:所述至少一个第一展示行为中被点击的概率
、
所述至少一个第一展示行为中被下载的概率
、
所述至少一个第一展示行为中被购买的概率或者所述至少一个第一展示行为中被播放的概率
。8.
一种贡献值的获取方法,其特征在于,所述方法包括:获取第一样本,所述第一样本指示至少一个展示行为,所述至少一个展示行为中有被交互过;通过第三机器学习模型生成所述第一样本指向的每个展示行为的贡献值,所述每个展
示行为的贡献值代表所述每个展示行为对所述至少一个展示行为被交互做出的贡献,所述第三机器学习模型基于执行过训练操作的第二机器学习模型得到;其中,所述训练操作采用的损失函数指示与第一训练样本对应的第一信息和第二信息之间的相似度,所述第一训练样本指示至少一个第一展示行为,所述第一信息通过第一机器学习模型得到,所述第一信息指示所述至少一个第一展示行为被交互的概率,所述第二信息通过所述第二机器学习模型得到,所述第二信息指示所述至少一个第一展示行为中每个第一展示行为的贡献值之和,所述每个第一展示行为的贡献值代表所述每个第一展示行为对所述至少一个第一展示行为被交互做出的贡献
。9.
根据权利要求8所述的方法,其特征在于,第三展示行为是所述第一样本指示的至少一个展示行为中的任意一个,其中,所述第三展示行为的贡献值基于与所述第三展示行为对应的第一值和第二值得到,与所述第三展示行为对应的所述第一值代表所述第三展示行为自身的贡献值,与所述第三展示行为对应的所述第二值代表所述第一样本指示的至少一个展示行为中所述第三展示行为之外其他的展示行为对所述第三展示行为的贡献值的影响值
。10.
根据权利要求9所述的方法,其特征在于,所述第一样本还包括所述第一样本指示的展示行为的展示时间,其中,所述第一样本指示的至少一个展示行为中所述第三展示行为之外其他的展示行为对所述第三展示行为的贡献值与第二时间距离相关,所述第二时间距离为所述第三展示行为的展示时间与所述其他的展示行为的展示时间之间的距离
。11.
根据权利要求8至
10
任一项所述的方法,其特征在于,所述第一训练样本来源于训练数据集,所述训练数据集中存在第二训练样本,其中,所述第二训练样本基于第三训练样本得到,所述第三训练样本包括至少一个第二展示行为的展示时间,对所述第三训练样本中的至少一个展示时间进行更新得到所述第二训练样本
。12.
一种数据处理装置,其特征在于,所述装置包括:处理模块,用于将第一训练样本输入第一机器学习模型,得到所述第一机器学习模型输出的第一信息,其中,所述第一训练样本指示至少一个第一展示行为,所述第一信息指示所述至少一个第一展示行为被交互的概率;所述处理模块,用于通过第二机器学习模型对所述第一训练样本进行处理得到第二信息,所述第二信息指示所述至少一个第一展示行为中每个第一展示行为的贡献值之和,所述每个第一展示行为的贡献值代表所述每个第一展示行为对所述至少一个第一展示行为被交互做出的贡献;训练模块,用于根据损失函数对所述第二机器学习模型进行训练,直至满足收敛条件,得到执行过训练操作的所述第二机器学习模型,其中,所述损失函数指示所述第一信息和所述第二信息之间的相似度,所述执行过训练操作的所述第...
【专利技术属性】
技术研发人员:武楚涵,贾庆林,李辰宇,董振华,唐睿明,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。