预测模型的生成方法技术

技术编号:39894981 阅读:9 留言:0更新日期:2023-12-30 13:08
本发明专利技术公开了一种预测模型的生成方法

【技术实现步骤摘要】
预测模型的生成方法、物品推荐方法、装置、设备和介质


[0001]本专利技术涉及计算机
,具体涉及一种预测模型的生成方法

物品推荐方法

装置

设备和介质


技术介绍

[0002]随着移动互联网的蓬勃发展,个性化推荐系统逐渐兴起,日渐成为了人们生活中不可分割的重要组成部分

个性化推荐算法可以根据用户信息以及历史记录来为用户做出个性化推荐,是一种减轻信息过载的有效工具

[0003]相关技术中,常用的推荐算法是根据物品或用户兴趣点之间的相似性,来提供推荐结果

但是,当用户兴趣点改变时,将造成推荐结果不准确


技术实现思路

[0004]为此,本专利技术提供一种预测模型的生成方法

物品推荐方法

装置

设备和介质,以解决相关技术中物品推荐结果不准确的问题

[0005]为了实现上述目的,本专利技术第一方面提供一种预测模型的生成方法,该方法包括:基于多个用户中每个用户的目标行为的历史记录进行建模,得到所述每个用户的时序点过程模型,所述时序点过程模型用于定义对应用户的事件序列,所述事件序列用于指示:直到第一时刻对应用户针对第一类型物品的目标行为次数,所述第一时刻为至少一个目标行为发生时刻中的任一时刻,所述第一类型为预定物品类型中的任一类型;通过学习所述每个用户的事件序列,从所述多个用户的事件序列中为目标序列选择相似事件序列,得到所述目标序列的邻居事件序列,其中,所述目标序列为目标用户的事件序列;将所述目标序列与所述邻居事件序列叠加,得到叠加后的目标序列;根据所述叠加后的目标序列学习所述时序点过程模型的模型参数,并根据学习到的模型参数生成预测模型,所述预测模型用于预测所述目标用户对每个类型物品的目标行为的概率值

[0006]其中,所述通过学习所述每个用户的事件序列,从所述多个用户的事件序列中为目标序列选择相似事件序列,包括:通过预定的强化学习算法学习所述多个用户的事件序列,得到所述目标序列对应的收益矩阵,所述收益矩阵中的第
u
行第
k
列的元素值用于指示:在第
u
个霍克斯过程中选择第
k
个事件序列的收益值,每个霍克斯过程包括所述多个用户的事件序列,
u

k
的取值大于或等于1且小于或等于所述用户总数量;根据所述收益矩阵中每个霍克斯过程中的每个事件序列对应的收益值,从所述多个用户的事件序列中选择预定数量个事件序列,作为所述目标序列的相似事件序列

[0007]其中,所述通过预定的强化学习算法学习所述多个用户的事件序列,得到所述目标序列对应的收益矩阵,包括:计算目标用户的事件序列与第一用户的事件序列之间的最优传输矩阵,其中,所述最优传输矩阵用于使所述目标用户的事件序列与所述第一用户的事件序列之间的传输距离最小;其中,第一用户为所述多个用户中除所述目标用户之外的任一用户;对所述每个用户的事件序列进行多次迭代处理,在每次迭代处理过程中,根据所
述最优传输矩阵确定初始收益,所述初始收益为所述收益矩阵中的第
u
行第
k
列所对应的收益值的初始值,并根据学习到的模型参数更新所述收益矩阵;根据所述多次迭代处理后的更新的收益矩阵,确定所述到所述目标序列对应的收益矩阵

[0008]其中,迭代处理的总次数为
L

L
为大于1的整数;所述根据学习到的模型参数更新所述收益矩阵,包括:对于前
L
‑1次中的每次迭代处理,以预定概率采样所述预定数量个事件序列;对于第
L
次迭代处理,按照收益降序选择所述预定数量个事件序列;合并每次迭代处理得到的事件序列,得到迭代处理后的事件序列集合;利用从所述事件序列结合中学习到的模型参数,更新所述收益矩阵

[0009]其中,所述根据所述收益矩阵中每个霍克斯过程中的每个事件序列对应的收益值,从所述多个用户的事件序列中选择预定数量个事件序列,作为所述目标序列的相似事件序列,包括:对于所述收益矩阵中每个霍克斯过程的每个事件序列对应的收益值,按照收益值降序选择所述预定邻居数量个收益值;将所述按照收益值降序选择的预定邻居数量个收益值,作为所述目标序列的相似事件序列

[0010]其中,所述根据所述叠加后的目标序列学习所述时序点过程模型的模型参数,包括:学习所述叠加后的目标序列,得到所述多个用户的参数集合,所述参数集合中包括学习到的基础强度和学习到的传播矩阵;根据所述多个用户的学习到的基础强度构建基础强度向量;对所述多个用户的学习到的传播矩阵进行融合,得到全局传播矩阵;根据所述基础强度向量和所述全局传播矩阵,确定学习到的所述时序点过程模型的模型参数

[0011]本专利技术第二方面提供一种物品推荐方法,该方法包括:获取目标用户的目标行为的历史记录,所述历史记录用于记录:直到第一时刻所述目标用户的每次目标行为的发生时刻和所对应物品的类型;利用预测模型对所述目标用户的目标行为的历史记录进行处理,得到所述目标用户对每个类型物品的目标行为的概率值;其中,所述预测模型是根据上述任一项的预测模型的生成方法,对获取的多个用户中每个用户的目标行为的历史记录进行处理得到的模型;根据所述概率值确定至少一个类型的物品作为所述第一时刻之后的预定时刻的推荐物品

[0012]本专利技术第三方面提供一种预测模型的生成装置,该装置包括:建模模块,用于基于多个用户中每个用户的目标行为的历史记录进行建模,得到所述每个用户的时序点过程模型,所述时序点过程模型用于定义对应用户的事件序列,所述事件序列用于指示:直到第一时刻对应用户针对第一类型物品的目标行为次数,所述第一时刻为至少一个目标行为发生时刻中的任一时刻,所述第一类型为预定物品类型中的任一类型;选择模块,用于通过学习所述每个用户的事件序列,从所述多个用户的事件序列中为目标序列选择相似事件序列,得到所述目标序列的邻居事件序列,其中,所述目标序列为目标用户的事件序列;叠加模块,用于将所述目标序列与所述邻居事件序列叠加,得到叠加后的目标序列;生成模块,用于根据所述叠加后的目标序列学习所述时序点过程模型的模型参数,并根据学习到的模型参数生成预测模型,所述预测模型用于预测所述目标用户对每个类型物品的目标行为的概率值

[0013]本专利技术第四方面提供一种物品推荐装置,该装置包括:获取模块,用于获取目标用户的目标行为的历史记录,所述历史记录用于记录:直到第一时刻所述目标用户的每次目标行为的发生时刻和所对应物品的类型;处理模块,用于利用预测模型对所述目标用户的
目标行为的历史记录进行处理,得到所述目标用户对每个类型物品的目标行为的概率值;其中,所述预测模型是根据权利要求1‑6中任一项的预测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种预测模型的生成方法,其特征在于,包括:基于多个用户中每个用户的目标行为的历史记录进行建模,得到所述每个用户的时序点过程模型,所述时序点过程模型用于定义对应用户的事件序列,所述事件序列用于指示:直到第一时刻对应用户针对第一类型物品的目标行为次数,所述第一时刻为至少一个目标行为发生时刻中的任一时刻,所述第一类型为预定物品类型中的任一类型;通过学习所述每个用户的事件序列,从所述多个用户的事件序列中为目标序列选择相似事件序列,得到所述目标序列的邻居事件序列,其中,所述目标序列为目标用户的事件序列;将所述目标序列与所述邻居事件序列叠加,得到叠加后的目标序列;根据所述叠加后的目标序列学习所述时序点过程模型的模型参数,并根据学习到的模型参数生成预测模型,所述预测模型用于预测所述目标用户对每个类型物品的目标行为的概率值
。2.
根据权利要求1所述的方法,其特征在于,所述通过学习所述每个用户的事件序列,从所述多个用户的事件序列中为目标序列选择相似事件序列,包括:通过预定的强化学习算法学习所述多个用户的事件序列,得到所述目标序列对应的收益矩阵,所述收益矩阵中的第
u
行第
k
列的元素值用于指示:在第
u
个霍克斯过程中选择第
k
个事件序列的收益值,每个霍克斯过程包括所述多个用户的事件序列,
u

k
的取值大于或等于1且小于或等于所述用户总数量;根据所述收益矩阵中每个霍克斯过程中的每个事件序列对应的收益值,从所述多个用户的事件序列中选择预定数量个事件序列,作为所述目标序列的相似事件序列
。3.
根据权利要求2所述的方法,其特征在于,所述通过预定的强化学习算法学习所述多个用户的事件序列,得到所述目标序列对应的收益矩阵,包括:计算目标用户的事件序列与第一用户的事件序列之间的最优传输矩阵,其中,所述最优传输矩阵用于使所述目标用户的事件序列与所述第一用户的事件序列之间的传输距离最小;其中,第一用户为所述多个用户中除所述目标用户之外的任一用户;对所述每个用户的事件序列进行多次迭代处理,在每次迭代处理过程中,根据所述最优传输矩阵确定初始收益,所述初始收益为所述收益矩阵中的第
u
行第
k
列所对应的收益值的初始值,并根据学习到的模型参数更新所述收益矩阵;根据所述多次迭代处理后的更新的收益矩阵,确定所述到所述目标序列对应的收益矩阵
。4.
根据权利要求3所述的方法,其特征在于,迭代处理的总次数为
L

L
为大于1的整数;所述根据学习到的模型参数更新所述收益矩阵,包括:对于前
L
‑1次中的每次迭代处理,以预定概率采样所述预定数量个事件序列;对于第
L
次迭代处理,按照收益降序选择所述预定数量个事件序列;合并每次迭代处理得到的事件序列,得到迭代处理后的事件序列集合;利用从所述事件序列结合中学习到的模型参数,更新所述收益矩阵
。5.
根据权利要求2所述的方法,其特征在于,所述根据所述收益矩阵中每个霍克斯过程中的每个事件序列对应的收益值,从所述多个用户的事件序列中选择预定数量个事件序列,作为所述目标序列的相似事件序列,包括:
对于所述收益矩阵中每个霍克斯过程的每个事件序列对应的收益值,按照收益值降序选择所述预定...

【专利技术属性】
技术研发人员:袁深许洪腾吴浩然
申请(专利权)人:中国人民大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1