【技术实现步骤摘要】
预测模型的生成方法、物品推荐方法、装置、设备和介质
[0001]本专利技术涉及计算机
,具体涉及一种预测模型的生成方法
、
物品推荐方法
、
装置
、
设备和介质
。
技术介绍
[0002]随着移动互联网的蓬勃发展,个性化推荐系统逐渐兴起,日渐成为了人们生活中不可分割的重要组成部分
。
个性化推荐算法可以根据用户信息以及历史记录来为用户做出个性化推荐,是一种减轻信息过载的有效工具
。
[0003]相关技术中,常用的推荐算法是根据物品或用户兴趣点之间的相似性,来提供推荐结果
。
但是,当用户兴趣点改变时,将造成推荐结果不准确
。
技术实现思路
[0004]为此,本专利技术提供一种预测模型的生成方法
、
物品推荐方法
、
装置
、
设备和介质,以解决相关技术中物品推荐结果不准确的问题
。
[0005]为了实现上述目的,本专利技术第一方面提供一种预测模型的生成方法,该方法包括:基于多个用户中每个用户的目标行为的历史记录进行建模,得到所述每个用户的时序点过程模型,所述时序点过程模型用于定义对应用户的事件序列,所述事件序列用于指示:直到第一时刻对应用户针对第一类型物品的目标行为次数,所述第一时刻为至少一个目标行为发生时刻中的任一时刻,所述第一类型为预定物品类型中的任一类型;通过学习所述每个用户的事件序列,从所述多个用户的事件序列中为 ...
【技术保护点】
【技术特征摘要】
1.
一种预测模型的生成方法,其特征在于,包括:基于多个用户中每个用户的目标行为的历史记录进行建模,得到所述每个用户的时序点过程模型,所述时序点过程模型用于定义对应用户的事件序列,所述事件序列用于指示:直到第一时刻对应用户针对第一类型物品的目标行为次数,所述第一时刻为至少一个目标行为发生时刻中的任一时刻,所述第一类型为预定物品类型中的任一类型;通过学习所述每个用户的事件序列,从所述多个用户的事件序列中为目标序列选择相似事件序列,得到所述目标序列的邻居事件序列,其中,所述目标序列为目标用户的事件序列;将所述目标序列与所述邻居事件序列叠加,得到叠加后的目标序列;根据所述叠加后的目标序列学习所述时序点过程模型的模型参数,并根据学习到的模型参数生成预测模型,所述预测模型用于预测所述目标用户对每个类型物品的目标行为的概率值
。2.
根据权利要求1所述的方法,其特征在于,所述通过学习所述每个用户的事件序列,从所述多个用户的事件序列中为目标序列选择相似事件序列,包括:通过预定的强化学习算法学习所述多个用户的事件序列,得到所述目标序列对应的收益矩阵,所述收益矩阵中的第
u
行第
k
列的元素值用于指示:在第
u
个霍克斯过程中选择第
k
个事件序列的收益值,每个霍克斯过程包括所述多个用户的事件序列,
u
和
k
的取值大于或等于1且小于或等于所述用户总数量;根据所述收益矩阵中每个霍克斯过程中的每个事件序列对应的收益值,从所述多个用户的事件序列中选择预定数量个事件序列,作为所述目标序列的相似事件序列
。3.
根据权利要求2所述的方法,其特征在于,所述通过预定的强化学习算法学习所述多个用户的事件序列,得到所述目标序列对应的收益矩阵,包括:计算目标用户的事件序列与第一用户的事件序列之间的最优传输矩阵,其中,所述最优传输矩阵用于使所述目标用户的事件序列与所述第一用户的事件序列之间的传输距离最小;其中,第一用户为所述多个用户中除所述目标用户之外的任一用户;对所述每个用户的事件序列进行多次迭代处理,在每次迭代处理过程中,根据所述最优传输矩阵确定初始收益,所述初始收益为所述收益矩阵中的第
u
行第
k
列所对应的收益值的初始值,并根据学习到的模型参数更新所述收益矩阵;根据所述多次迭代处理后的更新的收益矩阵,确定所述到所述目标序列对应的收益矩阵
。4.
根据权利要求3所述的方法,其特征在于,迭代处理的总次数为
L
,
L
为大于1的整数;所述根据学习到的模型参数更新所述收益矩阵,包括:对于前
L
‑1次中的每次迭代处理,以预定概率采样所述预定数量个事件序列;对于第
L
次迭代处理,按照收益降序选择所述预定数量个事件序列;合并每次迭代处理得到的事件序列,得到迭代处理后的事件序列集合;利用从所述事件序列结合中学习到的模型参数,更新所述收益矩阵
。5.
根据权利要求2所述的方法,其特征在于,所述根据所述收益矩阵中每个霍克斯过程中的每个事件序列对应的收益值,从所述多个用户的事件序列中选择预定数量个事件序列,作为所述目标序列的相似事件序列,包括:
对于所述收益矩阵中每个霍克斯过程的每个事件序列对应的收益值,按照收益值降序选择所述预定...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。