一种商品推荐模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:20046416 阅读:36 留言:0更新日期:2019-01-09 04:38
本发明专利技术实施例公开了一种商品推荐模型训练方法、装置、设备及存储介质,其中,该方法包括:获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间,以及获取各用户浏览商品的历史停留总时间;根据各用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定第一方差;根据所述历史停留总时间,确定商品对应的第二时间均值,并确定第二方差;根据第一时间均值、第一方差、第二时间均值以及第二方差,确定用户对商品的兴趣度;以商品的特征数据以及用户的特征数据为输入变量,以兴趣度为输出变量对设定模型进行训练,得到训练的商品推荐模型,可以准确预测用户对商品的兴趣度,从而增加推荐结果的点击率。

【技术实现步骤摘要】
一种商品推荐模型训练方法、装置、设备及存储介质
本专利技术实施例涉及数据处理技术,尤其涉及一种商品推荐模型训练方法、装置、设备及存储介质。
技术介绍
电子商务平台是个性化商品推荐系统的一大应用领域。其中,个性化商品推荐方式包括:基于用户的历史行为数据和实时行为数据,通过各种商品召回策略确定推荐商品的候选集;通过点击率预测模型确定候选集商品的展示顺序,点击概率高的商品优先被展示。其中,现有技术中,点击率预测模型的建模可以是:通过用户对商品的曝光和点击行为构建训练集,曝光未点击的样本的标签为0,曝光并点击的样本的标签为1;对模型进行训练,然后利用模型预测每个用户对候选集商品的点击概率,通过点击概率确定该用户的个性化商品推荐顺序,点击概率高的商品优先展示给该用户。但是上述建模的模型不能很好地刻画用户对商品的兴趣度。例如,用户可能只是误点了该商品,或者只是被吸引人的商品描述或者图片所迷惑,点击了该商品后即离开该商品相关页面。因此,预测模型最终预测出的用户点击概率也不能很好地反映用户真正的兴趣。
技术实现思路
本专利技术实施例提供一种商品推荐模型训练方法、装置、设备及存储介质,可以准确预测用户对商品的兴趣度,从而增加推荐结果的点击率。第一方面,本专利技术实施例提供了一种商品推荐模型训练方法,包括:获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间,以及获取各用户浏览所述商品的历史停留总时间;根据各所述用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定所述第一时间均值对应的第一方差;根据各所述用户浏览所述商品的所述历史停留总时间,确定所述商品对应的第二时间均值,并确定所述第二时间均值对应的第二方差;根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差,确定所述用户对所述商品的兴趣度;以所述商品的特征数据以及所述用户的特征数据为输入变量,以所述兴趣度为输出变量对设定模型进行训练,得到训练的商品推荐模型。第二方面,本专利技术实施例还提供了一种商品推荐模型训练装置,包括:获取模块,用于获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间,以及获取各用户浏览所述商品的历史停留总时间;第一确定模块,用于根据各所述用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定所述第一时间均值对应的第一方差;第二确定模块,用于根据各所述用户浏览所述商品的所述历史停留总时间,确定所述商品对应的第二时间均值,并确定所述第二时间均值对应的第二方差;第三确定模块,用于根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差,确定所述用户对所述商品的兴趣度;训练模块,用于以所述商品的特征数据以及所述用户的特征数据为输入变量,以所述兴趣度为输出变量对设定模型进行训练,得到训练的商品推荐模型。第三方面,本专利技术实施例还提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器本专利技术实施例提供的商品推荐模型训练方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术实施例提供的商品推荐模型训练方法。本专利技术实施例提供的技术方案,通过各用户浏览商品各页面的历史停留时间,确定各页面对应的第一时间均值,并确定第一时间均值对应的第一方差,通过各用户浏览商品的历史停留总时间,确定商品对应的第二时间均值,并确定第二时间均值对应的第二方差,通过第一时间均值、第一方差、第二时间均值以及第二方差,确定用户对商品的兴趣度;从而进行模型训练,得到训练模块,通过该模型可以准确预测用户对商品的兴趣度,从而增加推荐结果的点击率。附图说明图1是本专利技术实施例提供的一种商品推荐模型训练方法流程图;图2是本专利技术实施例提供的一种商品推荐模型训练装置结构框图;图3是本专利技术实施例提供的一种设备结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。图1是本专利技术实施例提供的一种商品推荐模型训练方法流程图,所述方法由一种商品推荐模型训练装置来执行,所述装置由软件和/或硬件来执行,所述装置可集成在终端、服务器等设备中。所述方法应用于对商品进行推荐的场景中。如图1所示,本专利技术实施例提供的方法包括:S110:获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间,以及获取各用户浏览所述商品的历史停留总时间。在本专利技术实施例中,用户浏览商品的历史停留总时间是用户浏览商品的首页、详情页以及评价页的总时间,例如,一个用户浏览商品的首页的历史停留时间是20s,浏览商品的详情页的历史停留时间是50s,浏览商品的评价页的历史停留时间是50s,则该用户浏览商品的历史停留总时间是50+50+20=120s。S120:根据各所述用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定所述第一时间均值对应的第一方差。S130:根据各所述用户浏览所述商品的所述历史停留总时间,确定所述商品对应的第二时间均值,并确定所述第二时间均值对应的第二方差。在本专利技术的实施例的一个实施方式中,根据各所述用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定所述第一时间均值对应的第一方差,包括:分别对各页面的历史停留时间取对数,并计算取对数的历史停留时间的平均值,并作为各页面对应的第一时间均值;根据取对数的历史停留时间以及所述第一时间均值,确定所述第一方差。相应的,所述根据各所述用户浏览所述商品的所述历史停留总时间确定所述商品对应的第二时间均值,并确定所述第二时间均值对应的第二方差,包括:对所述历史停留总时间取对数,并计算取对数的历史停留总时间的平均值,并作为第二时间均值;根据取对数的历史停留总时间以及所述第二时间均值确定所述第二方差。其中,对各页面的历史停留时间取对数,然后计算平均值,并作为各页面对应的第一时间均值,最后确定第一方差。例如,5个用户对一个商品的首页的历史停留时间分别是20s,10s,10s,20s和30s,分别对历史停留时间取对数,即分别对应log20、log10、log10、log20和log30,然后计算平均值,即(log20+log10+log10+log20+log30)/5,得到平均值,作为该商品的首页对应的第一时间均值。则第一方差的计算方法可以将log20、log10、log10、log20、log30以及(log20+log10+log10+log20+log30)/5代入方差公式进行计算。其中,该商品的其他页面对应的第一时间均值的计算方法与首页对应的第一时间均值的计算方法相同,则第一方差的计算方法也可以参照上述的方法。并且其他商品页面对应的第一时间均值以及第一方差的计算方法可参照上述方法。其中,根据用户浏览商品的历史停留总时间确定商品对应的第二时间均值,从而确定第二时间均值对应的第二方差。例如,共存在5个用户,每个用户浏览商品历史停留总时间是100s,120s,110s、50s本文档来自技高网...

【技术保护点】
1.一种商品推荐模型训练方法,其特征在于,包括:获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间,以及获取各用户浏览所述商品的历史停留总时间;根据各所述用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定所述第一时间均值对应的第一方差;根据各所述用户浏览所述商品的所述历史停留总时间,确定所述商品对应的第二时间均值,并确定所述第二时间均值对应的第二方差;根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差,确定所述用户对所述商品的兴趣度;以所述商品的特征数据以及所述用户的特征数据为输入变量,以所述兴趣度为输出变量对设定模型进行训练,得到训练的商品推荐模型。

【技术特征摘要】
1.一种商品推荐模型训练方法,其特征在于,包括:获取各用户分别浏览商品的首页、详情页以及评价页的历史停留时间,以及获取各用户浏览所述商品的历史停留总时间;根据各所述用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定所述第一时间均值对应的第一方差;根据各所述用户浏览所述商品的所述历史停留总时间,确定所述商品对应的第二时间均值,并确定所述第二时间均值对应的第二方差;根据所述第一时间均值、所述第一方差、所述第二时间均值以及所述第二方差,确定所述用户对所述商品的兴趣度;以所述商品的特征数据以及所述用户的特征数据为输入变量,以所述兴趣度为输出变量对设定模型进行训练,得到训练的商品推荐模型。2.根据权利要求1所述的方法,其特征在于,所述根据各所述用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定所述第一时间均值对应的第一方差,包括:分别对各页面的历史停留时间取对数,并计算取对数的历史停留时间的平均值,并作为各页面对应的第一时间均值;根据取对数的历史停留时间以及所述第一时间均值,确定所述第一方差;相应的,所述根据各所述用户浏览所述商品的所述历史停留总时间确定所述商品对应的第二时间均值,并确定所述第二时间均值对应的第二方差,包括:对所述历史停留总时间取对数,并计算取对数的历史停留总时间的平均值,并作为第二时间均值;根据取对数的历史停留总时间以及所述第二时间均值确定所述第二方差。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一时间均值、所述第一方差、第二时间均值以及所述第二方差,确定所述用户对所述商品的兴趣度,包括:根据如下的公式确定所述用户对所述商品的兴趣度:其中,Pui为第u个用户对商品i的兴趣度;其中,j是商品页面的编号;其中,tij=exp(μi+σ×zcj);μi为针对商品i,取对数的历史停留总时间的平均值,或者为是商品i对应的第二时间均值,σi为所述μi对应的第二方差;其中,tcuij为第u个用户浏览商品i的第j页面的历史停留时间,ucj为针对商品i的第j页面,取对数的历史停留时间的平均值,或者为商品i的第j页面对应的第一时间均值;σcj为ucj对应的第一方差。4.根据权利要求1所述的方法,其特征在于,所述根据各所述用户浏览各页面的历史停留时间,分别确定各页面对应的第一时间均值,并分别确定所述第一时间均值对应的第一方差,包括:根据各所述用户浏览各页面的历史停留时间,分别计算各页面的历史停留时间的平均值,并作为各页面对应的第一时间均值;根据所述历史停留时间以及所述第一时间...

【专利技术属性】
技术研发人员:吴佳东
申请(专利权)人:深圳乐信软件技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1