System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于训练用户行为表征模型、预测用户行为的方法和装置制造方法及图纸_技高网

用于训练用户行为表征模型、预测用户行为的方法和装置制造方法及图纸

技术编号:40110963 阅读:7 留言:0更新日期:2024-01-23 19:10
本说明书的实施例提供了一种用于训练用户行为表征模型的方法和装置。在该用于训练用户行为表征模型的方法中,针对当前训练样本集中的各个当前训练样本,将当前训练样本的、作为样本输入部分的预定期间内的用户历史行为序列提供给当前用户行为表征模型,得到对应的用户行为序列表征向量;再将所得到的用户行为序列表征向量提供给当前行为分布预测模型,得到对应的用户行为分布预测结果;再根据所得到的用户行为分布预测结果与对应的、作为标签部分的后续历史行为序列所指示的行为分布之间的差异,确定预测损失值;在不满足训练结束条件的情况下,根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数。

【技术实现步骤摘要】

本说明书实施例通常涉及计算机,尤其涉及用于训练用户行为表征模型的方法和装置、用于预测用户行为的方法和装置。


技术介绍

1、随着人工智能技术的飞速发展,如何在不同场景下准确刻画用户的行为序列成为需要解决的问题。目前,通常采用借鉴自然语言处理技术的方法,构建被屏蔽的行为预测(masked behavior prediction,mbp)或下一行为预测(next behavior prediction,nbp)任务。但相比于人类语言往往遵循相对规范的语法结构,用户行为序列存在很大的随机性,因此适用于文本任务的通过上下文预测被屏蔽的词或基于前文预测后文具体内容的任务在用户行为序列的表征方面的效果还有待提升。


技术实现思路

1、鉴于上述,本说明书实施例提供了一种用于训练用户行为表征模型的方法和装置、用于预测用户行为的方法和装置。利用该方法、装置,可以提升对用户行为序列的表征效果,进而为更准确的预测提供基础。

2、根据本说明书的实施例的一个方面,提供一种用于训练用户行为表征模型的方法,包括:利用训练样本集循环执行下述模型训练过程,直到满足训练结束条件,所述训练样本集中的每个训练样本包括作为样本输入部分的预定期间内的用户历史行为序列和作为标签部分的后续历史行为序列:针对当前训练样本集中的各个当前训练样本,将该当前训练样本的预定期间内的用户历史行为序列提供给当前用户行为表征模型,得到对应的用户行为序列表征向量;将所得到的各个用户行为序列表征向量分别提供给当前行为分布预测模型,得到各个当前训练样本对应的用户行为分布预测结果;根据所得到的用户行为分布预测结果与对应的后续历史行为序列所指示的行为分布之间的差异,确定当前模型训练过程的预测损失值;以及响应于不满足训练结束条件,根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数。

3、根据本说明书的实施例的另一个方面,提供一种用于预测用户行为的方法,包括:获取目标用户的历史行为序列;将所述历史行为序列提供给用户行为表征模型,得到对应的行为序列表征向量,其中,所述用户行为表征模型基于对用户未来行为的分布的预测而训练得到;将所述行为序列表征向量提供给相应的下游预测任务模型,得到对应的预测结果。

4、根据本说明书的实施例的又一个方面,提供一种用于训练用户行为表征模型的装置,所述装置被配置为由训练单元利用训练样本集循环执行下述模型训练过程,直到满足训练结束条件,所述训练样本集中的每个训练样本包括作为样本输入部分的预定期间内的用户历史行为序列和作为标签部分的后续历史行为序列,所述训练单元包括:序列向量化模块,被配置为针对当前训练样本集中的各个当前训练样本,将该当前训练样本的预定期间内的用户历史行为序列提供给当前用户行为表征模型,得到对应的用户行为序列表征向量;预测模块,被配置为将所得到的各个用户行为序列表征向量分别提供给当前行为分布预测模型,得到各个当前训练样本对应的用户行为分布预测结果;损失确定模块,被配置为根据所得到的用户行为分布预测结果与对应的后续历史行为序列所指示的行为分布之间的差异,确定当前模型训练过程的预测损失值;以及所述装置还包括:参数调整单元,被配置为响应于不满足训练结束条件,根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数。

5、根据本说明书的实施例的再一个方面,提供一种用于预测用户行为的装置,包括:序列获取单元,被配置为获取目标用户的历史行为序列;序列表征单元,被配置为将所述历史行为序列提供给用户行为表征模型,得到对应的行为序列表征向量,其中,所述用户行为表征模型基于对用户未来行为的分布的预测而训练得到;结果预测单元,被配置为将所述行为序列表征向量提供给相应的下游预测任务模型,得到对应的预测结果。

6、根据本说明书的实施例的另一方面,提供一种用于训练用户行为表征模型的装置,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的用于训练用户行为表征模型的方法。

7、根据本说明书的实施例的另一方面,提供一种用于预测用户行为的装置,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的用于预测用户行为的方法。

8、根据本说明书的实施例的另一方面,提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的用于训练用户行为表征模型的方法和/或用于预测用户行为的方法。

9、根据本说明书的实施例的另一方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行来实现如上所述的用于训练用户行为表征模型的方法和/或用于预测用户行为的方法。

本文档来自技高网...

【技术保护点】

1.一种用于训练用户行为表征模型的方法,包括:

2.如权利要求1所述的方法,其中,每个训练样本的后续历史行为序列与时间窗口相对应,所述模型训练过程还包括:

3.如权利要求2所述的方法,其中,每个训练样本对应的时间窗口通过从设置有最大允许时间窗口的连续的时间段中随机采样得到。

4.如权利要求1到3中任一所述的方法,其中,所述用户行为表征模型包括行为嵌入层和行为序列表征模型,

5.如权利要求4所述的方法,其中,所述根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数包括:

6.如权利要求5所述的方法,其中,所述正则损失值通过以下步骤确定:

7.一种用于预测用户行为的方法,包括:

8.一种用于训练用户行为表征模型的装置,所述装置被配置为由训练单元利用训练样本集循环执行下述模型训练过程,直到满足训练结束条件,所述训练样本集中的每个训练样本包括作为样本输入部分的预定期间内的用户历史行为序列和作为标签部分的后续历史行为序列,所述训练单元包括:

9.一种用于预测用户行为的装置,包括:

10.一种用于训练用户行为表征模型的装置,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求1至6中任一所述的方法。

11.一种用于预测用户行为的装置,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求7所述的方法。

...

【技术特征摘要】

1.一种用于训练用户行为表征模型的方法,包括:

2.如权利要求1所述的方法,其中,每个训练样本的后续历史行为序列与时间窗口相对应,所述模型训练过程还包括:

3.如权利要求2所述的方法,其中,每个训练样本对应的时间窗口通过从设置有最大允许时间窗口的连续的时间段中随机采样得到。

4.如权利要求1到3中任一所述的方法,其中,所述用户行为表征模型包括行为嵌入层和行为序列表征模型,

5.如权利要求4所述的方法,其中,所述根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数包括:

6.如权利要求5所述的方法,其中,所述正则损失值通过以下步骤确定:

7.一种用于预测用户行为的方法,包括:

8.一种用于训练用户行为表征...

【专利技术属性】
技术研发人员:傅驰林吴伟昌张晓露周俊李长升
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1