模型训练方法、商品推荐方法、装置、设备及介质制造方法及图纸

技术编号:36498682 阅读:17 留言:0更新日期:2023-02-01 15:19
本申请提供一种模型训练方法、商品推荐方法、装置、设备及介质。该方法包括:获取初始样本数据集;根据初始样本数据集,获取第一样本数据集;所述第一样本数据集中每个第一样本用户的样本数据包括:基于初始样本数据得到的第一样本用户的特征向量,以及,第一样本用户的标签向量;所述特征向量用于表征所述第一样本用户的短期意图特征,以及,长期偏好特征;利用第一样本数据集对初始模型进行训练,得到训练好的第一预测模型;然后通过该第一预测模型预测目标用户的商品偏好向量;根据该商品偏好向量,从目标应用的商品中确定待推荐商品;向目标用户的终端设备推送待推荐商品的商品信息。本申请的方法,提高了商品推荐的准确性。提高了商品推荐的准确性。提高了商品推荐的准确性。

【技术实现步骤摘要】
模型训练方法、商品推荐方法、装置、设备及介质


[0001]本申请涉及商品推荐技术,尤其涉及一种模型训练方法、商品推荐方法、装置、设备及介质。

技术介绍

[0002]通过推荐引擎对目标应用中用户感兴趣的商品进行推荐,以帮助用户更高效的找到自己所需的商品,降低信息过载,是在信息爆发的当今社会中常用的方法。
[0003]现有技术中,推荐引擎设置有多个模型,不同模型用于基于不同维度的用户数据进行商品推荐,导致上述商品推荐方法存在推荐准确度较低的问题。

技术实现思路

[0004]本申请提供一种模型训练方法、商品推荐方法、装置、设备及介质,用以解决推荐引擎推荐商品准确性较差的问题。
[0005]第一方面,本申请提供一种模型训练方法,所述方法包括:
[0006]获取初始样本数据集,所述初始样本数据集中每个第一样本用户的初始样本数据包括:所述第一样本用户的基础数据、所述第一样本用户的互联网使用数据;
[0007]根据所述初始样本数据集,获取第一样本数据集,所述第一样本数据集中每个第一样本用户的样本数据包括:基于所述初始样本数据得到的所述第一样本用户的特征向量,以及,所述第一样本用户的标签向量;所述特征向量用于表征所述第一样本用户的短期意图特征,以及,长期偏好特征,所述第一样本用户的标签向量用于表征目标应用的K类商品中所述第一样本用户偏好的商品类别,所述K为大于或等于2的整数;
[0008]利用所述第一样本数据集对初始模型进行训练,得到训练好的第一预测模型,所述第一预测模型用于根据目标用户的特征向量,获取所述目标用户商品偏好向量,所述偏好向量用于表征所述目标用户在所述目标应用的K类商品中偏好的商品类别。
[0009]可选的,所述根据所述初始第一样本数据集,获取第一样本数据集,包括:
[0010]针对每个所述第一样本用户的初始样本数据,执行如下操作:
[0011]根据所述第一样本用户的互联网使用数据中互联网的浏览行为数据,构建所述第一样本用户的短期意图特征向量;
[0012]若所述第一样本用户的互联网使用数据中包括目标类别的应用的浏览内容数据,则根据所述目标类别的应用的浏览内容数据,构建所述第一样本用户针对K类商品的第一长期偏好特征向量,并将第一预设特征向量作为所述第一样本用户针对K类商品的第二长期偏好特征向量,所述目标类别的应用包括:所述目标应用;
[0013]若所述第一样本用户的互联网使用数据中不包括所述目标类别的应用的浏览内容数据,则根据所述第一样本用户的基础数据,构建所述第一样本用户针对K类商品的第二长期偏好特征向量,并将预设第二特征向量作为所述第一样本用户针对K类商品的第一长期偏好特征向量;
[0014]根据所述第一样本用户的短期意图特征向量、第一长期偏好特征向量、第二长期偏好特征向量,构建所述第一样本用户的特征向量;
[0015]获取每个所述第一样本用户的标签向量,并根据每个所述第一样本用户的特征向量,以及,每个所述第一样本用户的标签向量,构建所述第一样本数据集。
[0016]可选的,所述根据所述第一样本用户的互联网使用数据中互联网的浏览行为数据,构建所述第一样本用户的短期意图特征向量,包括:
[0017]根据所述第一样本用户的互联网使用数据中互联网的浏览行为数据,获取所述第一样本用户针对多类应用中的每类应用在不同时间滑窗内的短期意图特征,以及,所述第一样本用户针对每类应用的每个子类应用在不同时间滑窗内的短期意图特征;
[0018]根据所述第一样本用户针对每类应用在不同时间滑窗内的短期意图特征,以及,所述第一样本用户针对每类应用的每个子类应用在不同时间滑窗内的短期意图特征,构建所述第一样本用户的短期意图特征向量。
[0019]可选的,所述根据所述目标类别的应用的浏览内容数据,构建所述第一样本用户针对K类商品的第一长期偏好特征向量,包括:
[0020]根据所有第一样本用户针对所述目标类别的应用的浏览内容数据,获取全量商品向量矩阵,所述全量商品向量矩阵包括所有第一样本用户在所述目标类别的应用上浏览过的所有商品的向量;
[0021]对所述全量商品向量矩阵进行聚类,得到K类商品的分类结果;
[0022]根据所述第一样本用户针对所述目标类别的应用的浏览内容数据,以及,所述分类结果,获取所述第一样本用户的第一长期偏好特征向量。
[0023]可选的,所述根据所有第一样本用户针对所述目标类别的应用的浏览内容数据,获取所述全量商品向量矩阵,包括:
[0024]根据各所述第一样本用户针对所述目标类别的应用的浏览内容数据,获取各所述第一样本用户的浏览特征向量;所述浏览特征向量用于表征所述第一样本用户浏览过的商品;
[0025]根据各所述第一样本用户的浏览特征向量,获取浏览特征向量矩阵;所述浏览特征向量矩阵包括所有用户的浏览特征向量;
[0026]利用所述浏览特征向量矩阵,获取所述全量商品向量矩阵。
[0027]可选的,所述根据所述第一样本用户针对所述目标类别的应用的浏览内容数据,以及,所述分类结果,获取所述第一样本用户的第一长期偏好特征向量,包括:
[0028]根据所述第一样本用户针对所述目标类别的应用的浏览内容数据,以及,所述分类结果,获取所述第一样本用户针对K类商品中每类商品的浏览概率;
[0029]根据所述第一样本用户针对K类商品中每类商品的浏览概率,得到所述第一样本用户的第一长期偏好特征向量。
[0030]可选的,所述根据所述第一样本用户的基础数据,构建所述第一样本用户针对K类商品的第二长期偏好特征向量,包括:
[0031]对所述全量商品向量矩阵进行聚类处理,得到K类商品的中心向量矩阵;
[0032]根据所述第一样本用户的基础数据,获取所述第一样本用户的基础数据向量;
[0033]将所述第一样本用户的基础数据向量,以及,所述中心向量矩阵输入至预先训练
好的第二预测模型,得到所述第一样本用户针对K类商品的预测评分;所述第二预测模型为采用第二样本数据集训练得到的,所述第二样本数据集中每个第二样本用户的样本数据包括:第二样本用户的基础数据向量、第二样本用户的商品向量矩阵,以及,所述第二样本用户对商品的评分向量;所述第二样本用户的商品向量矩阵包括所述第二样本用户在所述目标类别的应用上浏览过的所有商品的向量;
[0034]根据所述第一样本用户针对K类商品的预测评分,得到所述第一样本用户的第二长期偏好特征向量。
[0035]可选的,所述根据所述第一样本用户的短期意图特征向量、第一长期偏好特征向量、第二长期偏好特征向量,构建所述第一样本用户的特征向量,包括:
[0036]根据所有第一样本用户的第一长期偏好特征向量,获取所述第一样本用户针对K类商品的每类商品的第一偏好分位点;
[0037]根据所有所述第一样本用户的第二长期偏好特征向量,获取所述第一样本用户针对K类商品的每类商品的第二偏好分位点;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取初始样本数据集,所述初始样本数据集中每个第一样本用户的初始样本数据包括:所述第一样本用户的基础数据、所述第一样本用户的互联网使用数据;根据所述初始样本数据集,获取第一样本数据集,所述第一样本数据集中每个第一样本用户的样本数据包括:基于所述初始样本数据得到的所述第一样本用户的特征向量,以及,所述第一样本用户的标签向量;所述特征向量用于表征所述第一样本用户的短期意图特征,以及,长期偏好特征,所述第一样本用户的标签向量用于表征目标应用的K类商品中所述第一样本用户偏好的商品类别,所述K为大于或等于2的整数;利用所述第一样本数据集对初始模型进行训练,得到训练好的第一预测模型,所述第一预测模型用于根据目标用户的特征向量,获取所述目标用户商品偏好向量,所述偏好向量用于表征所述目标用户在所述目标应用的K类商品中偏好的商品类别。2.根据权利要求1所述的方法,其特征在于,所述根据所述初始第一样本数据集,获取第一样本数据集,包括:针对每个所述第一样本用户的初始样本数据,执行如下操作:根据所述第一样本用户的互联网使用数据中互联网的浏览行为数据,构建所述第一样本用户的短期意图特征向量;若所述第一样本用户的互联网使用数据中包括目标类别的应用的浏览内容数据,则根据所述目标类别的应用的浏览内容数据,构建所述第一样本用户针对K类商品的第一长期偏好特征向量,并将第一预设特征向量作为所述第一样本用户针对K类商品的第二长期偏好特征向量,所述目标类别的应用包括:所述目标应用;若所述第一样本用户的互联网使用数据中不包括所述目标类别的应用的浏览内容数据,则根据所述第一样本用户的基础数据,构建所述第一样本用户针对K类商品的第二长期偏好特征向量,并将预设第二特征向量作为所述第一样本用户针对K类商品的第一长期偏好特征向量;根据所述第一样本用户的短期意图特征向量、第一长期偏好特征向量、第二长期偏好特征向量,构建所述第一样本用户的特征向量;获取每个所述第一样本用户的标签向量,并根据每个所述第一样本用户的特征向量,以及,每个所述第一样本用户的标签向量,构建所述第一样本数据集。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一样本用户的互联网使用数据中互联网的浏览行为数据,构建所述第一样本用户的短期意图特征向量,包括:根据所述第一样本用户的互联网使用数据中互联网的浏览行为数据,获取所述第一样本用户针对多类应用中的每类应用在不同时间滑窗内的短期意图特征,以及,所述第一样本用户针对每类应用的每个子类应用在不同时间滑窗内的短期意图特征;根据所述第一样本用户针对每类应用在不同时间滑窗内的短期意图特征,以及,所述第一样本用户针对每类应用的每个子类应用在不同时间滑窗内的短期意图特征,构建所述第一样本用户的短期意图特征向量。4.根据权利要求2或3所述的方法,其特征在于,所述根据所述目标类别的应用的浏览内容数据,构建所述第一样本用户针对K类商品的第一长期偏好特征向量,包括:根据所有第一样本用户针对所述目标类别的应用的浏览内容数据,获取全量商品向量
矩阵,所述全量商品向量矩阵包括所有第一样本用户在所述目标类别的应用上浏览过的所有商品的向量;对所述全量商品向量矩阵进行聚类,得到K类商品的分类结果;根据所述第一样本用户针对所述目标类别的应用的浏览内容数据,以及,所述分类结果,获取所述第一样本用户的第一长期偏好特征向量。5.根据权利要求4所述的方法,其特征在于,所述根据所有第一样本用户针对所述目标类别的应用的浏览内容数据,获取所述全量商品向量矩阵,包括:根据各所述第一样本用户针对所述目标类别的应用的浏览内容数据,获取各所述第一样本用户的浏览特征向量;所述浏览特征向量用于表征所述第一样本用户浏览过的商品;根据各所述第一样本用户的浏览特征向量,获取浏览特征向量矩阵;所述浏览特征向量矩阵包括所有用户的浏览特征向量;利用所述浏览特征向量矩阵,获取所述全量商品向量矩阵。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一样本用户针对所述目标类别的应用的浏览内容数据,以及,所述分类结果,获取所述第一样本用户的第一长期偏好特征向量,包括:根据所述第一样本用户针对所述目标类别的应用的浏览内容数据,以及,所述分类结果,获取所述第一样本用户针对K类商品中每类商品的浏览概率;根据所述第一样本用户针对K类商品中每类商品的浏览概率,得到所述第一样本用户的第一长期偏好特征向量。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一样本用户的基础数据,构建所述第一样本用户针对K类商品的第二长期偏好特征向量,包括:对所述全量商品向量矩阵进行聚类处理,得到K类商品的中心向量矩阵;根据所述第一样本用户的基础数据,获取所述第一样本用户的基础数据向量;将所述第一样本用户的基础数据向量,以及,所述中心向量矩阵输入至预先训练好的第二预测模型,得到所述第一样本用户针对K类商品的预测评分;所述第二预测模型为采用第二样本数据集训练得到的,所述第二样本数据集中每个第二样本用户的样本数据包括:第二样本用户的基础数据向量、第二样本用户的商品向量矩阵,以及,所述第二样本用户对商品的评分向量;所述第二样本用户的商品向量矩阵包括所述第二样本用户在所述目标类别的应用上浏览过的所有商品的向量;根据所述第一样本用户针对K类商品的预测评分,得到所述第一样本用户的第二长期偏好特...

【专利技术属性】
技术研发人员:张丝雨崔玲龙闫龙张天铭夏凡宋雨伦李大中
申请(专利权)人:联通数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1