目标模型的训练方法及装置制造方法及图纸

技术编号：42083903 阅读：20 留言：0更新日期：2024-07-19 17:00

本说明书实施例提供了目标模型的训练方法及装置，目标模型包括编码器和聚类网络，聚类网络中包括多个类簇的参数化的聚类原型。该方法包括：利用编码器，确定多个用户各自的编码结果，编码结果包括基于用户的原始行为序列得到的原始编码；利用聚类网络，基于各聚类原型和各原始编码确定各用户各自的聚类结果；基于各用户的编码结果与所归属的类簇的聚类原型之间的元素分布差异，确定自蒸馏损失；其中，该类簇基于聚类结果确定；基于训练损失，更新编码器的参数，训练损失包括自蒸馏损失。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书实施例涉及计算机，具体地，涉及目标模型的训练方法及装置。

技术介绍

1、以往序列推荐模型鲜少关注对低活用户的建模，一些长序列建模相关工作在实际推荐场景落地并取得显著的业务结果，实验分析收益主要来自于具备丰富历史行为数据的高活用户人群。然而在大部分推荐营销场景中，用户占比最大的仍然是行为稀疏的低活用户。

2、迫切需要一种合理、可靠的方案，能够增强用户行为序列的表征，特别是低活用户的行为序列的表征。

技术实现思路

1、本说明书实施例提供了目标模型的训练方案，能提升目标模型中的编码器的表征能力，从而增强用户行为序列的表征，特别是低活用户的行为序列的表征。

2、第一方面，本说明书实施例提供了一种目标模型的训练方法，所述目标模型包括编码器和聚类网络，所述聚类网络中包括多个类簇的参数化的聚类原型，所述方法包括：利用所述编码器，确定多个用户各自的编码结果，所述编码结果包括基于用户的原始行为序列得到的原始编码；利用所述聚类网络，基于各聚类原型和各原始编码确定各用户各自的聚类...

【技术保护点】

1.一种目标模型的训练方法，所述目标模型包括编码器和聚类网络，所述聚类网络中包括多个类簇的参数化的聚类原型，所述方法包括：

2.根据权利要求1所述的方法，其中，所述编码结果还包括，基于用户的增强行为序列得到的增强编码，所述增强行为序列通过对所述原始行为序列进行增强处理而获得。

3.根据权利要求2所述的方法，其中，所述目标模型还包括数据增强网络，所述数据增强网络包括第一算子和第二算子，所述第一算子对所述原始行为序列进行增强处理得到第一增强行为序列，所述第二算子对所述原始行为序列进行增强处理得到第二增强行为序列；

4.根据权利要求2所述的方法，其中，所述确...

【技术特征摘要】

1.一种目标模型的训练方法，所述目标模型包括编码器和聚类网络，所述聚类网络中包括多个类簇的参数化的聚类原型，所述方法包括：

4.根据权利要求2所述的方法，其中，所述确定自蒸馏损失，包括：

5.根据权利要求2所述的方法，还包括：

6.根据权利要求5所述的方法，其中，单个用户的所述增强编码包括，针对第一增强行为序列得到的第一增强编码，和针对第二增强行为序列得到的第二增强编码；

7.根据权利要求1-6之一所述的方法，还包括：

8.根据权利要求7所述的方法，其中，所述基于各聚类原型和各原始编码，构建各用户各自的聚类标签，包括：

...

【专利技术属性】
技术研发人员：韦绍玮，吴郑伟，李欣，吴沁桐，刘子奇，张志强，周俊，顾立宏，顾进杰，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人