一种数据处理方法技术

技术编号:39580364 阅读:7 留言:0更新日期:2023-12-03 19:31
本申请实施例公开一种数据处理方法

【技术实现步骤摘要】
一种数据处理方法、贡献值的获取方法以及相关设备


[0001]本申请涉及人工智能领域,尤其涉及一种数据处理方法

贡献值的获取方法以及相关设备


技术介绍

[0002]人工智能
(Artificial Intelligence

AI)
是利用数字计算机或者数字计算机控制的机器模拟

延伸和扩展人的智能,感知环境

获取知识并使用知识获得最佳结果的理论

方法

技术及应用系统

换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器

人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知

推理与决策的功能

[0003]将人工智能技术应用于推荐系统中是一种场景的应用方式,在推荐系统中,可以向用户多次展示同一对象,用户可能在该对象的某个展示行为中与该对象产生交互,为了能够对该对象的投放策略进行优化,可以利用机器学习模型来预测每个展示行为的转化率
(post

click conversion rate

CVR)
,也即可以利用机器学习模型来预测每个展示行为对该对象被交互带来的贡献值

[0004]目前采用的一种方式包括:在获取到该对象的
n
个展示行为,
n
个展示行为中有被交互过之后,需要穷举前述
n
个展示行为能够组成的所有集合,利用机器学习模型来生成每个集合中的至少一个展示行为被交互的概率,进而根据每个集合中至少一个展示行为被交互的概率,计算每个展示行为的夏普离职,将每个展示行为的夏普利值确定为每个展示行为的贡献值

[0005]但是,由于在计算每个展示行为的贡献值的过程中,需要穷举
n
个展示行为能够组成的所有集合,并计算每个集合中至少一个展示行为被交互的概率,计算开销巨大


技术实现思路

[0006]本申请实施例提供了一种数据处理方法

贡献值的获取方法以及相关设备,通过第二机器学习模型能够直接获得至少一个展示行为中每个展示行为的贡献值,不再需要穷举前述至少一个展示行为能够组成的所有集合后,遍历每个集合中至少一个展示行为被交互的概率,大大降低了“每个展示行为的贡献值”的计算过程中所消耗的计算资源

[0007]为解决上述技术问题,本申请实施例提供以下技术方案:
[0008]第一方面,本申请实施例提供一种数据处理方法,可将人工智能技术用于对推荐系统中的展示行为进行归因,方法包括:训练设备将第一训练样本输入第一机器学习模型,得到第一机器学习模型输出的第一信息,其中,第一训练样本指示至少一个第一展示行为,第一信息指示至少一个第一展示行为被交互的概率;示例性地,第一训练样本包括每个第一展示行为的描述信息

[0009]训练设备通过第二机器学习模型对第一训练样本进行处理得到第二信息,第二信息指示至少一个第一展示行为中每个第一展示行为的贡献值之和,每个第一展示行为的贡
献值代表每个第一展示行为对至少一个第一展示行为被交互做出的贡献

[0010]训练设备根据第一损失函数对第二机器学习模型进行训练,直至满足第一收敛条件,得到执行过训练操作的第二机器学习模型;其中,第一损失函数指示第一信息和第二信息之间的相似度,利用第一损失函数进行训练的目标包括提高与第一训练样本对应的第一信息和第二信息之间的相似度;执行过训练操作的第二机器学习模型用于在应用阶段得到至少一个展示行为中每个展示行为的贡献值

[0011]本实现方式中,将第一训练样本输入第一机器学习模型,得到第一机器学习模型输出的第一信息,其中,第一训练样本指示至少一个第一展示行为,第一信息指示至少一个第一展示行为被交互的概率;将第一训练样本输入第二机器学习模型,得到第二机器学习模型输出的第二信息,第二信息指示至少一个第一展示行为中每个第一展示行为的贡献值之和,每个第一展示行为的贡献值代表每个第一展示行为对至少一个第一展示行为被交互做出的贡献;根据损失函数对第二机器学习模型进行训练,直至满足收敛条件,得到执行过训练操作的第二机器学习模型,损失函数指示第一信息和第二信息之间的相似度,通过前述方案能够得到执行过训练操作的第二机器学习模型,通过第二机器学习模型能够直接获得至少一个展示行为中每个展示行为的贡献值,不再需要穷举前述至少一个展示行为能够组成的所有集合后,遍历每个集合中至少一个展示行为被交互的概率,大大降低了“每个展示行为的贡献值”的计算过程中所消耗的计算资源

[0012]在一种可能实现方式中,第一训练样本指示的至少一个第一展示行为可以为对同一对象的展示行为,例如,第一训练样本指向的至少一个第一展示行为可以为对同一个应用程序的展示行为;又例如,第一训练样本指向的至少一个展示行为可以为对同一个新闻的展示行为;又例如,第一训练样本指向的至少一个展示行为可以为对同一个商品的展示行为等

[0013]在一种可能实现方式中,目标展示行为是至少一个第一展示行为中的任意一个,其中,目标展示行为的贡献值基于与目标展示行为对应的第一值和第二值得到,与目标展示行为对应的第一值代表目标展示行为自身的贡献值,与目标展示行为对应的第二值代表第一训练样本指示的至少一个第一展示行为中目标展示行为之外其他的第一展示行为对目标展示行为的贡献值的影响值

[0014]本实现方式中,在生成目标展示行为的贡献值的过程中,还考虑了其他展示行为对目标展示行为的贡献值的影响值,前述方案能够反映出用户在多次看到某一对象的实际情况,也即前述方案与实际情况更相符,则有利于得到每个展示行为更为准确的贡献值

[0015]在一种可能实现方式中,第一训练样本包括每个第一展示行为的展示时间,其中,第一训练样本指示的至少一个第一展示行为中目标展示行为之外其他的第一展示行为对目标展示行为的贡献值与第一时间距离相关,第一时间距离为目标展示行为的展示时间与其他的第一展示行为的展示时间之间的距离

[0016]本实现方式中,由于用户看到两个广告相隔的时间越久,前一广告对当前广告造成的影响就会越小,而本申请中其他展示行为对目标展示行为的贡献值也与两个展示行为之间的时间距离有关,也即本申请中目标展示行为的贡献值的确定方法与实际情况更相符,有利于提高最后得到的每个展示行为的贡献值的准确性

[0017]在一种可能实现方式中,在计算至少一个第一展示行为中展示时间早于目标展示
行为的第一展示行为对目标展示行为的贡献值的影响值时采用第一参数,在计算至少一个第一展示行为中展示时间晚于目标展示行为的第一展示行为对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种数据处理方法,其特征在于,所述方法包括:将第一训练样本输入第一机器学习模型,得到所述第一机器学习模型输出的第一信息,其中,所述第一训练样本指示至少一个第一展示行为,所述第一信息指示所述至少一个第一展示行为被交互的概率;通过第二机器学习模型对所述第一训练样本进行处理得到第二信息,所述第二信息指示所述至少一个第一展示行为中每个第一展示行为的贡献值之和,所述每个第一展示行为的贡献值代表所述每个第一展示行为对所述至少一个第一展示行为被交互做出的贡献;根据损失函数对所述第二机器学习模型进行训练,直至满足收敛条件,得到执行过训练操作的所述第二机器学习模型,其中,所述损失函数指示所述第一信息和所述第二信息之间的相似度,所述执行过训练操作的所述第二机器学习模型用于得到至少一个展示行为中每个展示行为的贡献值
。2.
根据权利要求1所述的方法,其特征在于,目标展示行为是所述至少一个第一展示行为中的任意一个,其中,所述目标展示行为的贡献值基于与所述目标展示行为对应的第一值和第二值得到,与所述目标展示行为对应的所述第一值代表所述目标展示行为自身的贡献值,与所述目标展示行为对应的所述第二值代表所述第一训练样本指示的至少一个第一展示行为中所述目标展示行为之外其他的第一展示行为对所述目标展示行为的贡献值的影响值
。3.
根据权利要求2所述的方法,其特征在于,所述第一训练样本包括所述第一展示行为的展示时间,其中,所述第一训练样本指示的至少一个第一展示行为中所述目标展示行为之外其他的第一展示行为对所述目标展示行为的贡献值与第一时间距离相关,所述第一时间距离为所述目标展示行为的展示时间与所述其他的第一展示行为的展示时间之间的距离
。4.
根据权利要求1至3任一项所述的方法,其特征在于,所述第一训练样本来源于训练数据集,所述训练数据集中存在第二训练样本,其中,所述第二训练样本基于第三训练样本得到,所述第三训练样本包括至少一个第二展示行为的展示时间,对所述第三训练样本中的至少一个展示时间进行更新得到所述第二训练样本
。5.
根据权利要求1至3任一项所述的方法,其特征在于,所述执行过训练操作的所述第二机器学习模型中参数的值用于得到至少一个展示行为中每个展示行为的贡献值
。6.
根据权利要求1至3任一项所述的方法,其特征在于,所述第一机器学习模型为预先训练过的,所述第一机器学习模型为如下任一种:循环神经网络

卷积神经网络

全连接神经网络或者注意力基于注意力机制的神经网络
。7.
根据权利要求1至3任一项所述的方法,其特征在于,所述至少一个第一展示行为被交互的概率为如下任一种:所述至少一个第一展示行为中被点击的概率

所述至少一个第一展示行为中被下载的概率

所述至少一个第一展示行为中被购买的概率或者所述至少一个第一展示行为中被播放的概率
。8.
一种贡献值的获取方法,其特征在于,所述方法包括:获取第一样本,所述第一样本指示至少一个展示行为,所述至少一个展示行为中有被交互过;通过第三机器学习模型生成所述第一样本指向的每个展示行为的贡献值,所述每个展
示行为的贡献值代表所述每个展示行为对所述至少一个展示行为被交互做出的贡献,所述第三机器学习模型基于执行过训练操作的第二机器学习模型得到;其中,所述训练操作采用的损失函数指示与第一训练样本对应的第一信息和第二信息之间的相似度,所述第一训练样本指示至少一个第一展示行为,所述第一信息通过第一机器学习模型得到,所述第一信息指示所述至少一个第一展示行为被交互的概率,所述第二信息通过所述第二机器学习模型得到,所述第二信息指示所述至少一个第一展示行为中每个第一展示行为的贡献值之和,所述每个第一展示行为的贡献值代表所述每个第一展示行为对所述至少一个第一展示行为被交互做出的贡献
。9.
根据权利要求8所述的方法,其特征在于,第三展示行为是所述第一样本指示的至少一个展示行为中的任意一个,其中,所述第三展示行为的贡献值基于与所述第三展示行为对应的第一值和第二值得到,与所述第三展示行为对应的所述第一值代表所述第三展示行为自身的贡献值,与所述第三展示行为对应的所述第二值代表所述第一样本指示的至少一个展示行为中所述第三展示行为之外其他的展示行为对所述第三展示行为的贡献值的影响值
。10.
根据权利要求9所述的方法,其特征在于,所述第一样本还包括所述第一样本指示的展示行为的展示时间,其中,所述第一样本指示的至少一个展示行为中所述第三展示行为之外其他的展示行为对所述第三展示行为的贡献值与第二时间距离相关,所述第二时间距离为所述第三展示行为的展示时间与所述其他的展示行为的展示时间之间的距离
。11.
根据权利要求8至
10
任一项所述的方法,其特征在于,所述第一训练样本来源于训练数据集,所述训练数据集中存在第二训练样本,其中,所述第二训练样本基于第三训练样本得到,所述第三训练样本包括至少一个第二展示行为的展示时间,对所述第三训练样本中的至少一个展示时间进行更新得到所述第二训练样本
。12.
一种数据处理装置,其特征在于,所述装置包括:处理模块,用于将第一训练样本输入第一机器学习模型,得到所述第一机器学习模型输出的第一信息,其中,所述第一训练样本指示至少一个第一展示行为,所述第一信息指示所述至少一个第一展示行为被交互的概率;所述处理模块,用于通过第二机器学习模型对所述第一训练样本进行处理得到第二信息,所述第二信息指示所述至少一个第一展示行为中每个第一展示行为的贡献值之和,所述每个第一展示行为的贡献值代表所述每个第一展示行为对所述至少一个第一展示行为被交互做出的贡献;训练模块,用于根据损失函数对所述第二机器学习模型进行训练,直至满足收敛条件,得到执行过训练操作的所述第二机器学习模型,其中,所述损失函数指示所述第一信息和所述第二信息之间的相似度,所述执行过训练操作的所述第...

【专利技术属性】
技术研发人员:武楚涵贾庆林李辰宇董振华唐睿明
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1