【技术实现步骤摘要】
训练样本生成、模型训练、点击率评估方法及电子设备
[0001]本申请涉及计算机
,尤其涉及一种训练样本生成、模型训练、点击率评估方法及电子设备。
技术介绍
[0002]平台(例如电子商务网站、APP)可以使用推荐系统,根据用户的兴趣特点及用户对物品的行为数据,向用户推荐的物品。具体的,推荐系统可以包括排序模型,排序模型可以根据用户的兴趣特点及对用户对物品的行为数据,针对平台将要展示给用户的每一个物品,预测用户点击该物品的概率值。可以基于多个物品的预测概率值,对物品进行排序,生成推荐集并展示给用户。例如,按照用户点击物品的概率值的大小进行排序,将概率值大的物品排在首位。
[0003]用户对物品的行为数据可以包括正反馈行为数据及负反馈行为数据。正反馈行为数据包括表征用户对物品感兴趣的行为数据,例如可以是用户点击物品、用户购买物品、用户收藏物品等。负反馈行为数据包括表征用户对物品不感兴趣的行为数据,例如可以是用户拉黑物品、用户删除物品等。
[0004]相关技术中,在使用排序模型预测用户点击物品的概率值时,通常只采用用户的正反馈行为数据训练排序模型,或者将用户的负反馈行为数据简单拼接在正反馈行为数据上共同参与排序模型的训练。由于负反馈行为数据的数据量通常较少,将正反馈行为数据及负反馈行为数据一起输入排序模型中进行算法处理,会造成负反馈信息丢失。也就是说,相关技术中负反馈行为数据的利用率较低,但是正反馈行为特征数据和负反馈行为特征数据都可以反映用户偏好。在进行排序模型的训练时,主要使用正反馈行为数据,而不 ...
【技术保护点】
【技术特征摘要】
1.一种排序模型的训练样本生成方法,其特征在于,所述排序模型用于预测第一用户点击平台提供的物品的概率值,所述方法包括:采集所述第一用户针对物品的行为数据,所述行为数据包括正反馈行为数据及负反馈行为数据,所述正反馈行为数据包括表征所述第一用户对所述物品感兴趣的行为数据,所述负反馈行为数据包括表征所述第一用户对所述物品不感兴趣的行为数据;通过第一嵌入层处理所述正反馈行为数据得到第一正反馈特征向量,通过第二嵌入层处理所述负反馈行为数据得到第一负反馈特征向量;将所述第一正反馈特征向量及所述第一负反馈特征向量进行拼接,得到第一交叉特征向量;根据所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量;其中,k为大于等于1的整数,所述第k+1正反馈特征向量与所述概率值的关联度高于所述第一正反馈特征向量与所述概率值的关联度,所述第k+1负反馈特征向量与所述概率值的关联度高于所述第一负反馈特征向量与所述概率值的关联度,所述第k+1交叉特征向量与所述概率值的关联度高于所述第一交叉特征向量与所述概率值的关联度;将所述第k+1正反馈特征向量、所述第k+1负反馈特征向量及所述第k+1交叉特征向量进行拼接,得到用于训练所述排序模型的训练样本。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:将所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量输入至少一个更新元,得到所述第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量;其中,所述更新元用于筛选所述第一正反馈特征向量中与所述概率值关联度高的向量元素、所述第一负反馈特征向量中与所述概率值关联度高的向量元素、所述第一交叉特征向量中与所述概率值关联度高的向量元素。3.根据权利要求2所述的方法,其特征在于,所述将所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量输入至少一个更新元,得到所述第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:将第k
‑
1正反馈特征向量、第k
‑
1负反馈特征向量及第k
‑
1交叉特征向量,输入第k
‑
1更新元,得到第k正反馈特征向量、第k负反馈特征向量及第k交叉特征向量,其中,所述第k正反馈特征向量、所述第k负反馈特征向量及所述第k交叉特征向量与所述概率值的关联度高于所述第k
‑
1正反馈特征向量、所述第k
‑
1负反馈特征向量及所述第k
‑
1交叉特征向量与所述概率值的关联度;将所述第k正反馈特征向量、所述第k负反馈特征向量及所述第k交叉特征向量,输入第k更新元,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,其中,所述第k+1正反馈特征向量、所述第k+1负反馈特征向量及所述第k+1交叉特征向量与所述概率值的关联度高于所述第k正反馈特征向量、所述第k负反馈特征向量及所述第k交叉特征向量与所述概率值的关联度,k为大于等于1的整数;
其中,当所述k等于1时,所述第k
‑
1正反馈特征向量为所述第一正反馈特征向量、所述第k
‑
1负反馈特征向量为所述第一负反馈特征向量及所述第k
‑
1交叉特征向量为所述第一交叉特征向量。4.根据权利要求1所述的方法,其特征在于,在根据所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量之前,所述方法包括:通过第一全连接层处理所述第一正反馈特征向量,通过第二全连接层处理所述第一负反馈特征向量,通过第三全连接层处理所述第一交叉特征向量;其中,所述根据所述第一正反馈特征向量、所述第一负反馈特征向量及所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量,包括:根据所述通过第一全连接层处理后的所述第一正反馈特征向量、所述通过第二全连接层处理后的所述第一负反馈正特向量及所述通过第三全连接层处理后的所述第一交叉特征向量,得到第k+1正反馈特征向量、第k+1负反馈特征向量及第k+1交叉特征向量。5.根据权利要求4所述的方法,其特征在于,采用以下公式:;;;;;;根据所述第一正反馈特征向量、所述第一负反馈特征向量...
【专利技术属性】
技术研发人员:侯越,冯晓东,李虎,徐琼,王淼,
申请(专利权)人:荣耀终端有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。