物品推荐模型的训练方法、存储介质及相关设备技术

技术编号:36840495 阅读:21 留言:0更新日期:2023-03-15 15:34
本申请实施例公开了一种物品推荐模型的训练方法、存储介质及相关设备,属于人工智能技术领域。该方法包括:重复以下各步骤,直至达到预设条件:对待训练数据进行多次训练得到多个输出数据;基于预设的与每一输出数据对应的第一训练权重,对多个输出数据进行调整得到第一训练数据;并基于预设的与每一输出数据对应的第二训练权重,对多个输出数据进行调整,得到第二训练数据;基于转化率模型对第一训练数据进行训练,基于点击通过率模型对第一训练数据进行训练,得到目标物品的预测购买概率;根据目标物品的预测购买概率,调整物品推荐模型中的各个参数。得到的物品推荐模型在预测物品的购买概率的准确率较高;提升了物品的购买概率的识别准确率。率的识别准确率。率的识别准确率。

【技术实现步骤摘要】
物品推荐模型的训练方法、存储介质及相关设备


[0001]本申请涉及人工智能
,尤其涉及一种物品推荐模型的训练方法、存储介质及相关设备。

技术介绍

[0002]随着人工智能技术的发展以及网络技术的发展,为了便于人们的生活,可以通过网络向用户推荐物品。
[0003]现有技术中,可以采用完整空间多任务模型(Entire Space Multi

Task Model,简称ESMM)对样本物品(包括了用户所点击过的物品、用户所收藏过的物品)和目标物品进行多目标的训练,在训练过程中基于ESMM模型中的转化率(Conversion Rate,简称CVR)模型对样本物品进行训练得到转化率,并基于ESMM模型中的点击通过率(Click

Through

Rate,简称CVR)模型对样本物品进行训练得到点击通过率,然后基于转化率和点击通过率得到目标物品的预测购买概率;基于预测购买概率调整ESMM模型的参数。进而得到一个用于识别物品的购买概率的ESMM模型。
[0004]然而现有技术中,在对ESMM模型进行训练的过程中,采用同样的数据(即,样本物品)对ESMM模型中的转化率模型进行训练、对ESMM模型中的点击通过率模型进行训练,造成CVR训练过程、CTR训练过程两者数据相关性较弱,进而所得到的用于识别物品的购买概率的ESMM模型,在识别物品的购买概率的时候,识别准确率较低。

技术实现思路

[0005]本申请实施例提供了一种基于摄像头的图像处理方法、存储介质及相关设备,可以解决显示的图像的角度、位置是有偏差的,进而导致不便于用户观看终端设备显示出的图像,不便于用户观看终端设备所采集的图像所对应的物品的真实信息的问题。所述技术方案如下:
[0006]第一方面,本申请实施例提供了一种物品推荐模型的训练方法,所述物品推荐模型中配置有转化率模型和点击通过率模型;所述方法包括:
[0007]获取待训练数据,并重复以下各步骤,直至达到预设条件:
[0008]对所述待训练数据进行多次训练,得到多个输出数据;其中,所述待训练数据中包括待训练的物品点击序列和目标物品;所述待训练的物品点击序列中包括与用户对应的至少一个样本物品;
[0009]基于预设的与每一输出数据对应的第一训练权重,对所述多个输出数据进行调整,得到第一训练数据;并基于预设的与每一输出数据对应的第二训练权重,对所述多个输出数据进行调整,得到第二训练数据;
[0010]基于所述转化率模型对所述第一训练数据进行训练,并基于所述点击通过率模型对所述第一训练数据进行训练,以得到所述目标物品的预测购买概率;
[0011]根据所述目标物品的预测购买概率、所述目标物品的真实购买概率,调整所述物
品推荐模型中的各个参数。
[0012]在可行一种实施方式中,所述物品推荐模型中配置有第一门控模型;基于预设的与每一输出数据对应的第一训练权重,对所述多个输出数据进行调整,得到第一训练数据,包括:
[0013]采用第一门控模型对所述待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第一训练权重;
[0014]将每一输出数据、与每一输出数据对应的第一训练权重两者进行相乘处理,得到每一输出数据所对应的第一中间信息;
[0015]根据对各输出数据所对应的第一中间信息进行向量加权求和处理,得到所述第一训练数据。
[0016]在可行一种实施方式中,所述物品推荐模型中还配置有第二门控模型;基于预设的与每一输出数据对应的第二训练权重,对所述多个输出数据进行调整,得到第二训练数据,包括:
[0017]采用第二门控模型对所述待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第二训练权重;
[0018]将每一输出数据、与每一输出数据对应的第二训练权重两者进行相乘处理,得到每一输出数据所对应的第二中间信息;
[0019]根据对各输出数据所对应的第二中间信息进行向量加权求和处理,得到所述第二训练数据;
[0020]其中,所述第一门控模型所采用的参数与所述第二门控模型所采用的参数不同。
[0021]在可行一种实施方式中,所述物品推荐模型中配置有多个训练模型;对所述待训练数据进行多次训练,得到多个输出数据,包括:
[0022]采用所述多个训练模型对所述待训练数据进行训练,得到多个输出数据;其中,不同的训练模型所采用的训练参数不同。
[0023]在可行一种实施方式中,所述待训练数据中还包括用户特征,所述用户特征中包括用户偏好特征;所述获取待训练数据,包括:
[0024]获取所述待训练的物品点击序列、所述目标物品、以及用户的用户历史数据;
[0025]将所述用户历史数据与标签组合进行匹配,其中,所述标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史数据;
[0026]根据与物品标签匹配的用户历史数据,确定用户偏好特征。
[0027]在可行一种实施方式中,所述用户历史数据包括至少一个历史触发物品、至少一个搜索词。
[0028]在可行一种实施方式中,将所述用户历史数据与标签组合进行匹配,得到与物品标签匹配的用户历史数据,包括:
[0029]将每一所述历史触发物品与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;
[0030]对所述至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一所述搜索关键字与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;
[0031]其中,与物品标签匹配的用户历史数据包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。
[0032]在可行一种实施方式中,所述待训练数据中的待训练的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;
[0033]其中,所述第一正样本集合中的样本物品为第一状态;所述第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏;
[0034]所述第二正样本集合包括第一子集合和第二子集合,所述第一子集合中的样本物品为第二状态,所述第二子集合中的样本物品为第三状态;所述第二状态为物品被点击且被购买;所述第三状态为物品被点击且具有购买链接、但物品未被购买;其中,所述第一子集合中的样本物品的参考权重,均大于所述第二子集合中的样本物品的参考权重;
[0035]所述负样本集合中的样本物品为第四状态;所述第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。
[0036]在可行一种实施方式中,在对所述待训练数据进行多次训练,得到多个输出数据之前,还包括:
[0037]基于注意力调整机制确定所述待训练数据中的每一样本物品与目标物品之间的相似度,得到所述待训练数据中的每一样本物品的分数权重;
[0038]根据所述待训练数据中的每一样本物品的分数权重对所述待训练本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物品推荐模型的训练方法,其特征在于,所述物品推荐模型中配置有转化率模型和点击通过率模型;所述方法包括:获取待训练数据,并重复以下各步骤,直至达到预设条件:对所述待训练数据进行多次训练,得到多个输出数据;其中,所述待训练数据中包括待训练的物品点击序列和目标物品;所述待训练的物品点击序列中包括与用户对应的至少一个样本物品;基于预设的与每一输出数据对应的第一训练权重,对所述多个输出数据进行调整,得到第一训练数据;并基于预设的与每一输出数据对应的第二训练权重,对所述多个输出数据进行调整,得到第二训练数据;基于所述转化率模型对所述第一训练数据进行训练,并基于所述点击通过率模型对所述第一训练数据进行训练,以得到所述目标物品的预测购买概率;根据所述目标物品的预测购买概率、所述目标物品的真实购买概率,调整所述物品推荐模型中的各个参数。2.根据权利要求1所述的方法,其特征在于,所述物品推荐模型中配置有第一门控模型;基于预设的与每一输出数据对应的第一训练权重,对所述多个输出数据进行调整,得到第一训练数据,包括:采用第一门控模型对所述待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第一训练权重;将每一输出数据、与每一输出数据对应的第一训练权重两者进行相乘处理,得到每一输出数据所对应的第一中间信息;根据对各输出数据所对应的第一中间信息进行向量加权求和处理,得到所述第一训练数据。3.根据权利要求2所述的方法,其特征在于,所述物品推荐模型中还配置有第二门控模型;基于预设的与每一输出数据对应的第二训练权重,对所述多个输出数据进行调整,得到第二训练数据,包括:采用第二门控模型对所述待训练数据依次进行维度转换处理、内积处理,得到与每一输出数据对应的第二训练权重;将每一输出数据、与每一输出数据对应的第二训练权重两者进行相乘处理,得到每一输出数据所对应的第二中间信息;根据对各输出数据所对应的第二中间信息进行向量加权求和处理,得到所述第二训练数据;其中,所述第一门控模型所采用的参数与所述第二门控模型所采用的参数不同。4.根据权利要求1所述的方法,其特征在于,所述待训练数据中还包括用户特征,所述用户特征中包括用户偏好特征;所述获取待训练数据,包括:获取所述待训练的物品点击序列、所述目标物品、以及用户的用户历史数据;将所述用户历史数据与标签组合进行匹配,其中,所述标签组合中包括至少一个物品标签,得到与物品标签匹配的用户历史数据;根据与物品标签匹配的用户历史数据,确定用户偏好特征。5.根据权利要求4所述的方法,其特征在于,所述用户历史数据包括至少一个历史触发
物品、至少一个搜索词。6.根据权利要求5所述的方法,其特征在于,将所述用户历史数据与标签组合进行匹配,得到与物品标签匹配的用户历史数据,包括:将每一所述历史触发物品与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的历史触发物品;对所述至少一个搜索词进行关键字提取处理,得到至少一个搜索关键字,并将每一所述搜索关键字与所述标签组合中的物品标签进行匹配,得到与物品标签匹配的搜索关键字;其中,与物品标签匹配的用户历史数据包括:与物品标签匹配的历史触发物品、与物品标签匹配的搜索关键字。7.根据权利要求1

6任一项所述的方法,其特征在于,所述待训练数据中的待训练的物品点击序列包括第一正样本集合、第二正样本集合和负样本集合;其中,所述第一正样本集合中的样本物品为第一状态;所述第一状态为以下的任意一种或多种:物品被点击、物品被分享、物品被收藏;所述第二正样本集合包括第一子集合和第二子集合,所述第一子集合中的样本物品为第二状态,所述第二子集合中的样本物品为第三状态;所述第二状态为物品被点击且被购买;所述第三状态为物品被点击且具有购买链接、但物品未被购买;其中,所述第一子集合中的样本物品的参考权重,均大于所述第二子集合中的样本物品的参考权重;所述负样本集合中的样本物品为第四状态;所述第四状态为以下的任意一种:物品未被点击、物品未被分享、物品未被收藏。8.根据权利要求1

6任一项所述的方法,其特征在于,在对所述待训练数据...

【专利技术属性】
技术研发人员:廖志
申请(专利权)人:广州视源人工智能创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1