训练样本生成、模型训练、点击率评估方法及电子设备技术

技术编号:37408406 阅读:15 留言:0更新日期:2023-04-30 09:34
本申请涉及计算机技术领域,尤其涉及一种训练样本生成、模型训练、点击率评估方法及电子设备,能够提高排序模型的预测准确率。方法包括:采集用户的正反馈行为数据及负反馈行为数据;通过第一嵌入层处理正反馈行为数据得到第一正反馈特征向量,通过第二嵌入层处理负反馈行为数据得到第一负反馈特征向量;将第一正反馈特征向量及第一负反馈特征向量进行拼接,得到第一交叉特征向量;根据第一正反馈特征向量、第一负反馈特征向量及第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量;根据第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量得到用于训练排序模型的训练样本。量得到用于训练排序模型的训练样本。量得到用于训练排序模型的训练样本。

【技术实现步骤摘要】
训练样本生成、模型训练、点击率评估方法及电子设备


[0001]本申请涉及计算机
,尤其涉及一种训练样本生成、模型训练、点击率评估方法及电子设备。

技术介绍

[0002]平台(例如电子商务网站、APP)可以使用推荐系统,根据用户的兴趣特点及用户对物品的行为数据,向用户推荐的物品。具体的,推荐系统可以包括排序模型,排序模型可以根据用户的兴趣特点及对用户对物品的行为数据,针对平台将要展示给用户的每一个物品,预测用户点击该物品的概率值。可以基于多个物品的预测概率值,对物品进行排序,生成推荐集并展示给用户。例如,按照用户点击物品的概率值的大小进行排序,将概率值大的物品排在首位。
[0003]用户对物品的行为数据可以包括正反馈行为数据及负反馈行为数据。正反馈行为数据包括表征用户对物品感兴趣的行为数据,例如可以是用户点击物品、用户购买物品、用户收藏物品等。负反馈行为数据包括表征用户对物品不感兴趣的行为数据,例如可以是用户拉黑物品、用户删除物品等。
[0004]相关技术中,在使用排序模型预测用户点击物品的概率值时,通常只采用用户的正反馈行为数据训练排序模型,或者将用户的负反馈行为数据简单拼接在正反馈行为数据上共同参与排序模型的训练。由于负反馈行为数据的数据量通常较少,将正反馈行为数据及负反馈行为数据一起输入排序模型中进行算法处理,会造成负反馈信息丢失。也就是说,相关技术中负反馈行为数据的利用率较低,但是正反馈行为特征数据和负反馈行为特征数据都可以反映用户偏好。在进行排序模型的训练时,主要使用正反馈行为数据,而不有效利用负反馈行为数据,会影响排序模型的训练效果,使得排序模型的预测效果不佳,进而影响推荐系统的推荐效果。

技术实现思路

[0005]有鉴于此,本申请提供了一种训练样本生成、模型训练、点击率评估方法及电子设备,能够提高排序模型的预测效果,提高推荐系统的推荐效果。
[0006]第一方面,本申请提供一种排序模型的训练样本生成方法,排序模型用于预测第一用户点击平台提供的物品的概率值,方法包括:采集第一用户针对物品的行为数据,行为数据包括正反馈行为数据及负反馈行为数据,正反馈行为数据包括表征第一用户对物品感兴趣的行为数据,负反馈行为数据包括表征第一用户对物品不感兴趣的行为数据;通过第一嵌入层处理正反馈行为数据得到第一正反馈特征向量,通过第二嵌入层处理负反馈行为数据得到第一负反馈特征向量;将第一正反馈特征向量及第一负反馈特征向量进行拼接,得到第一交叉特征向量;根据第一正反馈特征向量、第一负反馈特征向量及第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量;其中,k为大于等于1的整数,第k+1正反馈特征向量与概率值的关联度高于第一正反馈特征向量与概
率值的关联度,第k+1负反馈特征向量与概率值的关联度高于第一负反馈特征向量与概率值的关联度,第k+1交叉特征向量与概率值的关联度高于第一交叉特征向量与概率值的关联度;将第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量进行拼接,得到用于训练排序模型的训练样本。
[0007]本申请能够根据用户的正反馈行为数据与负反馈行为数据,提取到正负反馈行为数据中的交叉特征向量。并对由正反馈行为数据嵌入得来的正反馈特征向量、由负反馈行为数据嵌入得来的负反馈特征向量、及交叉特征向量进行迭代更新处理,筛选提取出正反馈特征向量、负反馈特征向量及交叉特征向量中更有用的特征数据(即与概率值关联程度更高的特征数据)。并且使正反馈特征向量、负反馈特征向量及交叉特征向量三者相互交互,避免在迭代更新过程中负反馈特征向量的丢失,能够更有效的利用负反馈行为数据。同时,提取到特征向量中更有用的特征数据,如此,能够得到包涵更多有用信息的特征向量,根据该特征向量得到训练样本,使用该训练样本训练排序模型能够提高排序模型的训练效果。
[0008]在第一方面的一种可能的实现方式中,根据第一正反馈特征向量、第一负反馈特征向量及第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:将第一正反馈特征向量、第一负反馈特征向量及第一交叉特征向量输入至少一个更新元,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量;其中,更新元用于筛选第一正反馈特征向量中与概率值关联度高的向量元素、第一负反馈特征向量中与概率值关联度高的向量元素、第一交叉特征向量中与概率值关联度高的向量元素。本申请采用更新元筛选第一正反馈特征向量、第一负反馈特征向量及第一交叉特征向量中与概率值关联度高的向量元素,有助于提取到更有用的特征数据。
[0009]在第一方面的一种可能的实现方式中,将第一正反馈特征向量、第一负反馈特征向量及第一交叉特征向量输入至少一个更新元,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:将第k

1正反馈特征向量、第k

1负反馈特征向量及第k

1交叉特征向量,输入第k

1更新元,得到第k正反馈特征向量、第k负反馈特征向量及第k交叉特征向量,其中,第k正反馈特征向量、第k负反馈特征向量及第k交叉特征向量与概率值的关联度高于第k

1正反馈特征向量、第k

1负反馈特征向量及第k

1交叉特征向量与概率值的关联度;将第k正反馈特征向量、第k负反馈特征向量及第k交叉特征向量,输入第k更新元,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,其中,第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量与概率值的关联度高于第k正反馈特征向量、第k负反馈特征向量及第k交叉特征向量与概率值的关联度,k为大于等于1的整数;其中,当k等于1时,第k

1正反馈特征向量为第一正反馈特征向量、第k

1负反馈特征向量为第一负反馈特征向量及第k

1交叉特征向量为第一交叉特征向量。该实现方式提供一种采用更新元迭代更新第一正反馈特征向量、第一负反馈特征向量及第一交叉特征向量的一种可能的实现方式。
[0010]在第一方面的一种可能的实现方式中,在根据第一正反馈特征向量、第一负反馈特征向量及第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量之前,方法包括:通过第一全连接层处理第一正反馈特征向量,通过第二全连接层处理第一负反馈特征向量,通过第三全连接层处理第一交叉特征向量;其中,根据第一
正反馈特征向量、第一负反馈特征向量及第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:根据通过第一全连接层处理后的第一正反馈特征向量、通过第二全连接层处理后的第一负反馈正特向量及通过第三全连接层处理后的第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种排序模型的训练样本生成方法,其特征在于,所述排序模型用于预测第一用户点击平台提供的物品的概率值,所述方法包括:采集所述第一用户针对物品的行为数据,所述行为数据包括正反馈行为数据及负反馈行为数据,所述正反馈行为数据包括表征所述第一用户对所述物品感兴趣的行为数据,所述负反馈行为数据包括表征所述第一用户对所述物品不感兴趣的行为数据;通过第一嵌入层处理所述正反馈行为数据得到第一正反馈特征向量,通过第二嵌入层处理所述负反馈行为数据得到第一负反馈特征向量;将所述第一正反馈特征向量及所述第一负反馈特征向量进行拼接,得到第一交叉特征向量;根据所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量;其中,k为大于等于1的整数,所述第k+1正反馈特征向量与所述概率值的关联度高于所述第一正反馈特征向量与所述概率值的关联度,所述第k+1负反馈特征向量与所述概率值的关联度高于所述第一负反馈特征向量与所述概率值的关联度,所述第k+1交叉特征向量与所述概率值的关联度高于所述第一交叉特征向量与所述概率值的关联度;将所述第k+1正反馈特征向量、所述第k+1负反馈特征向量及所述第k+1交叉特征向量进行拼接,得到用于训练所述排序模型的训练样本。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:将所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量输入至少一个更新元,得到所述第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量;其中,所述更新元用于筛选所述第一正反馈特征向量中与所述概率值关联度高的向量元素、所述第一负反馈特征向量中与所述概率值关联度高的向量元素、所述第一交叉特征向量中与所述概率值关联度高的向量元素。3.根据权利要求2所述的方法,其特征在于,所述将所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量输入至少一个更新元,得到所述第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:将第k

1正反馈特征向量、第k

1负反馈特征向量及第k

1交叉特征向量,输入第k

1更新元,得到第k正反馈特征向量、第k负反馈特征向量及第k交叉特征向量,其中,所述第k正反馈特征向量、所述第k负反馈特征向量及所述第k交叉特征向量与所述概率值的关联度高于所述第k

1正反馈特征向量、所述第k

1负反馈特征向量及所述第k

1交叉特征向量与所述概率值的关联度;将所述第k正反馈特征向量、所述第k负反馈特征向量及所述第k交叉特征向量,输入第k更新元,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,其中,所述第k+1正反馈特征向量、所述第k+1负反馈特征向量及所述第k+1交叉特征向量与所述概率值的关联度高于所述第k正反馈特征向量、所述第k负反馈特征向量及所述第k交叉特征向量与所述概率值的关联度,k为大于等于1的整数;
其中,当所述k等于1时,所述第k

1正反馈特征向量为所述第一正反馈特征向量、所述第k

1负反馈特征向量为所述第一负反馈特征向量及所述第k

1交叉特征向量为所述第一交叉特征向量。4.根据权利要求1所述的方法,其特征在于,在根据所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量之前,所述方法包括:通过第一全连接层处理所述第一正反馈特征向量,通过第二全连接层处理所述第一负反馈特征向量,通过第三全连接层处理所述第一交叉特征向量;其中,所述根据所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:根据所述通过第一全连接层处理后的所述第一正反馈特征向量、所述通过第二全连接层处理后的所述第一负反馈正特向量及所述通过第三全连接层处理后的所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量。5.根据权利要求4所述的方法,其特征在于,采用以下公式:;;;;;;根据所述第一正反馈特征向量、所述第一负反馈特征向量...

【专利技术属性】
技术研发人员:侯越冯晓东李虎徐琼王淼
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1