用于训练用户行为表征模型、预测用户行为的方法和装置制造方法及图纸

技术编号:40110963 阅读:25 留言:0更新日期:2024-01-23 19:10
本说明书的实施例提供了一种用于训练用户行为表征模型的方法和装置。在该用于训练用户行为表征模型的方法中,针对当前训练样本集中的各个当前训练样本,将当前训练样本的、作为样本输入部分的预定期间内的用户历史行为序列提供给当前用户行为表征模型,得到对应的用户行为序列表征向量;再将所得到的用户行为序列表征向量提供给当前行为分布预测模型,得到对应的用户行为分布预测结果;再根据所得到的用户行为分布预测结果与对应的、作为标签部分的后续历史行为序列所指示的行为分布之间的差异,确定预测损失值;在不满足训练结束条件的情况下,根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数。

【技术实现步骤摘要】

本说明书实施例通常涉及计算机,尤其涉及用于训练用户行为表征模型的方法和装置、用于预测用户行为的方法和装置。


技术介绍

1、随着人工智能技术的飞速发展,如何在不同场景下准确刻画用户的行为序列成为需要解决的问题。目前,通常采用借鉴自然语言处理技术的方法,构建被屏蔽的行为预测(masked behavior prediction,mbp)或下一行为预测(next behavior prediction,nbp)任务。但相比于人类语言往往遵循相对规范的语法结构,用户行为序列存在很大的随机性,因此适用于文本任务的通过上下文预测被屏蔽的词或基于前文预测后文具体内容的任务在用户行为序列的表征方面的效果还有待提升。


技术实现思路

1、鉴于上述,本说明书实施例提供了一种用于训练用户行为表征模型的方法和装置、用于预测用户行为的方法和装置。利用该方法、装置,可以提升对用户行为序列的表征效果,进而为更准确的预测提供基础。

2、根据本说明书的实施例的一个方面,提供一种用于训练用户行为表征模型的方法,包括:利用训练样本集循环本文档来自技高网...

【技术保护点】

1.一种用于训练用户行为表征模型的方法,包括:

2.如权利要求1所述的方法,其中,每个训练样本的后续历史行为序列与时间窗口相对应,所述模型训练过程还包括:

3.如权利要求2所述的方法,其中,每个训练样本对应的时间窗口通过从设置有最大允许时间窗口的连续的时间段中随机采样得到。

4.如权利要求1到3中任一所述的方法,其中,所述用户行为表征模型包括行为嵌入层和行为序列表征模型,

5.如权利要求4所述的方法,其中,所述根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数包括:

6.如权利要求5所述的方法,其中,所述...

【技术特征摘要】

1.一种用于训练用户行为表征模型的方法,包括:

2.如权利要求1所述的方法,其中,每个训练样本的后续历史行为序列与时间窗口相对应,所述模型训练过程还包括:

3.如权利要求2所述的方法,其中,每个训练样本对应的时间窗口通过从设置有最大允许时间窗口的连续的时间段中随机采样得到。

4.如权利要求1到3中任一所述的方法,其中,所述用户行为表征模型包括行为嵌入层和行为序列表征模型,

5.如权利要求4所述的方法,其中,所述根据所确定的预测损失值调整当前用户行为表征模型和当前行为分布预测模型的参数包括:

6.如权利要求5所述的方法,其中,所述正则损失值通过以下步骤确定:

7.一种用于预测用户行为的方法,包括:

8.一种用于训练用户行为表征...

【专利技术属性】
技术研发人员:傅驰林吴伟昌张晓露周俊李长升
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1