排序模型训练及推荐方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36812597 阅读:16 留言:0更新日期:2023-03-09 00:54
本发明专利技术实施例提供了排序模型训练及推荐方法、装置、电子设备及存储介质,方案为:获取多个样本查询词分别对应的候选图像;获取各个样本查询词分别对应的用户特征数据;在各样本查询词中选取一个样本查询词;将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入图像排序模型中,得到当前选取的样本查询词对应的多个候选图像的预测排序结果;获取当前选取的样本查询词的候选图像的排序标签;计算预测排序结果与排序标签之间的损失值;基于所得到的损失值对图像排序模型进行调参,选取样本查询词继续对图像排序模型进行训练,直至满足预设的训练结束条件,则停止模型训练,得到训练后的图像排序模型。可以提高推荐图像与用户的匹配程度。与用户的匹配程度。与用户的匹配程度。

【技术实现步骤摘要】
排序模型训练及推荐方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,特别是涉及一种排序模型训练及推荐方法、装置、电子设备及存储介质。

技术介绍

[0002]相关技术中,图像推荐系统能够根据用户输入的查询信息,查询到相应的图像,再将查询到的图像推荐给用户。例如,很多视频网站都带有评论系统,且自带表情包,只要用户输入几个字,就会弹出表情包候选列表,供用户选择。一般这种根据用户输入的查询信息查询相应图像的方法仅仅是基于查询信息的文本语义选择相应图像,即根据文本相似度进行选择,例如,在输入框输入“好的”,只会弹出包含“好的”字样的表情包,仅利用查询信息的文本语义查询图像,可能会使查询到的图像并不是用户想要得到的图像,导致推荐给用户的图像与用户的匹配程度较低。

技术实现思路

[0003]本专利技术实施例的目的在于提供一种图像图像排序模型训练方法、装置、电子设备及存储介质,以提高推荐的图像与用户的匹配程度。具体技术方案如下:
[0004]在本专利技术实施的第一方面,首先提供了一种图像排序模型训练方法,所述方法包括:
[0005]获取多个样本查询词分别对应的多个候选图像;
[0006]获取各个样本查询词分别对应的用户特征数据,其中,针对每一个样本查询词,该样本查询词对应的用户特征数据表示包含该样本查询词的请求指令中所携带的用户标识对应的特征数据;
[0007]在各所述样本查询词中选取一个样本查询词;
[0008]将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型中,得到当前选取的样本查询词对应的多个候选图像的预测排序结果;
[0009]获取当前选取的样本查询词的候选图像的排序标签;计算所述预测排序结果与所述排序标签之间的损失值;
[0010]基于所得到的损失值对所述图像排序模型进行调参,选取样本查询词继续对所述图像排序模型进行训练,直至满足预设的训练结束条件,则停止模型训练,得到训练后的图像排序模型。
[0011]在一种可能的实施方式中,所述将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型中,得到当前选取的样本查询词对应的多个候选图像的预测排序结果,包括:
[0012]将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型的概率预测网络中,得到所述多个候选图像分别对应的被点击预测概率,基于所述多个候选图像分别对应的被点击预测概率,对所述多个候选图像进行排序,得到所述预
测排序结果。
[0013]在一种可能的实施方式中,所述将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型的概率预测网络中,得到所述多个候选图像分别对应的被点击预测概率,基于所述多个候选图像分别对应的被点击预测概率,对所述多个候选图像进行排序,得到所述预测排序结果,包括:
[0014]对当前选取的样本查询词对应的多个候选图像进行两两组合,将每一组候选图像和当前选取的样本查询词对应的用户特征数据输入所述图像排序模型的概率预测网络中,得到每一组候选图像对应的被点击预测概率;
[0015]基于所述每一组候选图像对应的被点击预测概率,对每一组候选图像进行排序,得到预测排序结果。
[0016]在一种可能的实施方式中,所述将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型的概率预测网络中,得到所述多个候选图像分别对应的被点击预测概率,基于所述多个候选图像分别对应的被点击预测概率,对所述多个候选图像进行排序,得到所述预测排序结果,包括:
[0017]将当前选取的样本查询词对应的多个候选图像依次单张输入所述图像排序模型的概率预测网络中,并将当前选取的样本查询词对应的用户特征数据输入所述图像排序模型的概率预测网络中,分别得到每一张候选图像对应的被点击预测概率;
[0018]对已得到对应被点击预测概率的多个候选图像进行两两组合,得到每一组候选图像对应的被点击预测概率;
[0019]基于所述每一组候选图像对应的被点击预测概率,对每一组候选图像进行排序,得到预测排序结果。
[0020]在一种可能的实施方式中,所述计算所述预测排序结果与所述排序标签之间的损失值,包括:
[0021]针对每一组候选图像,基于所述每一组候选图像在所述多个候选图像中的预测排序结果,计算每一组候选图像在多个候选图像中的原本位置对应的归一化折损累计增益nDCG值,与每一组候选图像在多个候选图像中的对调位置对应的归一化折损累计增益nDCG值之差的绝对值,并将所述绝对值作为针对所述排序标签的权重;其中,所述原本位置为每一组候选图像在所述多个候选图像中的预测排序结果中对应的位置;
[0022]基于每一组候选图像对应的权重,确定所述预测排序结果与所述排序标签之间的损失值。
[0023]在一种可能的实施方式中,所述将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型的概率预测网络中,得到所述多个候选图像分别对应的被点击预测概率,包括:
[0024]针对每一候选图像,提取所述候选图像对应的图像特征数据;
[0025]对所述图像特征数据和所述用户特征数据进行一维向量化处理,得到一维向量化的用户特征数据和所述候选图像对应的一维向量化的图像特征数据;
[0026]将所述候选图像对应的一维向量化的图像特征数据与所述一维向量化的用户特征数据进行拼接,得到所述候选图像对应的拼接特征数据;
[0027]基于所述拼接特征数据,得到所述候选图像对应的被点击预测概率。
[0028]在一种可能的实施方式中,所述对所述图像特征数据和所述用户特征数据进行一维向量化处理,得到一维向量化的用户特征数据和所述候选图像对应的一维向量化的图像特征数据,包括:
[0029]将所述图像特征数据和所述用户特征数据划分为第一特征数据和第二特征数据;
[0030]对所述第一特征数据进行归一化处理,将归一化处理后的第一特征数据进行拼接,得到第一拼接结果,将所述第一拼接结果输入全连接层,得到一维向量化的第一特征数据;
[0031]对所述第二特征数据进行嵌入表示,将嵌入表示后的第二特征数据进行拼接,得到第二拼接结果,将所述第二拼接结果输入所述一维向量化层,得到一维向量化的第二特征数据。
[0032]在一种可能的实施方式中,所述用户特征数据至少包括:用户信息数据、用户历史行为数据、时间窗口特征数据、交叉特征数据。
[0033]在本专利技术实施的第二方面,还提供了一种图像推荐方法,所述方法适用于图像推荐服务器,所述方法包括:
[0034]图像推荐服务器接收图像展示终端发送的查询请求;
[0035]提取所述查询请求中的查询词以及用户标识;
[0036]根据所述用户标识获取对应的用户特征数据,所述用户特征数据表示包含所述查询词的查询请求指令中所携带的用户标识对应的特征数据;
...

【技术保护点】

【技术特征摘要】
1.一种图像排序模型训练方法,其特征在于,所述方法包括:获取多个样本查询词分别对应的多个候选图像;获取各个样本查询词分别对应的用户特征数据,其中,针对每一个样本查询词,该样本查询词对应的用户特征数据表示包含该样本查询词的请求指令中所携带的用户标识对应的特征数据;在各所述样本查询词中选取一个样本查询词;将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型中,得到当前选取的样本查询词对应的多个候选图像的预测排序结果;获取当前选取的样本查询词的候选图像的排序标签;计算所述预测排序结果与所述排序标签之间的损失值;基于所得到的损失值对所述图像排序模型进行调参,选取样本查询词继续对所述图像排序模型进行训练,直至满足预设的训练结束条件,则停止模型训练,得到训练后的图像排序模型。2.根据权利要求1所述的方法,其特征在于,所述将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型中,得到当前选取的样本查询词对应的多个候选图像的预测排序结果,包括:将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型的概率预测网络中,得到所述多个候选图像分别对应的被点击预测概率,基于所述多个候选图像分别对应的被点击预测概率,对所述多个候选图像进行排序,得到所述预测排序结果。3.根据权利要求2所述的方法,其特征在于,所述将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型的概率预测网络中,得到所述多个候选图像分别对应的被点击预测概率,基于所述多个候选图像分别对应的被点击预测概率,对所述多个候选图像进行排序,得到所述预测排序结果,包括:对当前选取的样本查询词对应的多个候选图像进行两两组合,将每一组候选图像和当前选取的样本查询词对应的用户特征数据输入所述图像排序模型的概率预测网络中,得到每一组候选图像对应的被点击预测概率;基于所述每一组候选图像对应的被点击预测概率,对每一组候选图像进行排序,得到预测排序结果。4.根据权利要求2所述的方法,其特征在于,所述将将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型的概率预测网络中,得到所述多个候选图像分别对应的被点击预测概率,基于所述多个候选图像分别对应的被点击预测概率,对所述多个候选图像进行排序,得到所述预测排序结果,包括:将当前选取的样本查询词对应的多个候选图像依次单张输入所述图像排序模型的概率预测网络中,并将当前选取的样本查询词对应的用户特征数据输入所述图像排序模型的概率预测网络中,分别得到每一张候选图像对应的被点击预测概率;对已得到对应被点击预测概率的多个候选图像进行两两组合,得到每一组候选图像对应的被点击预测概率;基于所述每一组候选图像对应的被点击预测概率,对每一组候选图像进行排序,得到
预测排序结果。5.根据权利要求1所述的方法,其特征在于,所述计算所述预测排序结果与所述排序标签之间的损失值,包括:针对每一组候选图像,基于所述每一组候选图像在所述多个候选图像中的预测排序结果,计算每一组候选图像在多个候选图像中的原本位置对应的归一化折损累计增益nDCG值,与每一组候选图像在多个候选图像中的对调位置对应的归一化折损累计增益nDCG值之差的绝对值,并将所述绝对值作为针对所述排序标签的权重;其中,所述原本位置为每一组候选图像在所述多个候选图像中的预测排序结果中对应的位置;基于每一组候选图像对应的权重,确定所述预测排序结果与所述排序标签之间的损失值。6.根据权利要求2所述的方法,其特征在于,所述将当前选取的样本查询词对应的多个候选图像以及用户特征数据输入所述图像排序模型的概率预测网络中,得到所述多个候选图像分别对应的被点击预测概率,包括:针对每一候选图像,提取所述候选图像对应的图像特征数据;对所述图像特征数据和所述用户特征数据进行一...

【专利技术属性】
技术研发人员:保俊杉龙翔
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1