用户表征模型的训练方法、用户表征方法及装置制造方法及图纸

技术编号：36080436 阅读：14 留言：0更新日期：2022-12-24 10:53

本说明书实施例提供用户表征模型的训练方法、用户表征方法及装置，其中所述用户表征模型的训练方法包括：获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；根据述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；基于第一相似度和第二相似度，对预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。通过该种方式训练得到的用户表征模型效果更好，确定的用户表征能够更加准确合理地表征用户属性。户属性。户属性。

全部详细技术资料下载

【技术实现步骤摘要】
用户表征模型的训练方法、用户表征方法及装置

[0001]本说明书实施例涉及机器学习
，特别涉及一种用户表征模型的训练方法、用户表征方法。

技术介绍

[0002]随着信息技术的发展，越来越多的用户服务都通过互联网等各种网络平台提供给用户，而用户在各种网络平台产生的行为能够在一定程度上反映用户的习惯、偏好等个人属性，因此，为了给用户带来更好的服务体验，可以基于用户的行为序列建模得到用户表征模型，根据该用户表征模型确定用户表征，以基于该用户表征为用户提供各项服务。
[0003]但通过目前的行为序列建模方式得到的用户表征模型，其仅能学习到用户的行为表征，导致确定的用户表征仅能表征用户的行为，无法准确地表征用户属性。因此，亟需一种训练方法来训练用户表征模型，使得该模型输出的用户表征能够准确地表征用户属性。

技术实现思路

[0004]有鉴于此，本说明书实施例提供了一种用户表征模型的训练方法。本说明书一个或者多个实施例同时涉及一种用户表征方法，一种用户表征模型的训练装置，一种用户表征装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面，提供了一种用户表征模型的训练方法，包括：
[0006]获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；
[0007]根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在...

【技术保护点】

【技术特征摘要】
1.一种用户表征模型的训练方法，包括：获取多个用户的样本行为序列，其中，任一用户的样本行为序列包括该用户在不同时间的行为描述信息；根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度；基于所述第一相似度和第二相似度，对所述预设机器学习网络进行训练，直至达到训练停止条件，获得用户表征模型。2.根据权利要求1所述的方法，所述根据各所述用户的样本行为序列，利用预设机器学习网络，获得各所述用户在不同时间的用户表征，包括：利用预设机器学习网络，基于第一用户的样本行为序列中的各行为描述信息，获得所述第一用户对应的行为表征序列，其中，所述第一用户是所述多个用户中的任一个；根据所述行为表征序列，确定所述第一用户在不同时间的用户表征。3.根据权利要求2所述的方法，在所述根据所述行为表征序列，确定所述第一用户在不同时间的用户表征之后，还包括：对所述第一用户在预设时间段内对应的用户表征进行融合，得到所述第一用户在所述预设时间段的用户表征。4.根据权利要求2所述的方法，所述预设机器学习网络包括特征提取层；所述利用预设机器学习网络，基于第一用户的样本行为序列中的各行为描述信息，获得所述第一用户对应的行为表征序列，包括：利用所述特征提取层，对第一用户的样本行为序列中的各行为描述信息进行特征提取，获得所述第一用户对应的初始行为表征序列，其中，所述初始行为表征序列中包括各行为描述信息对应的初始行为表征；确定第一行为描述信息与第二行为描述信息间的时间间隔，获得所述时间间隔的时间表征，其中，所述第一行为描述信息是所述样本行为序列中的任一个，所述第二行为描述信息是所述样本行为序列中与所述第一行为描述信息时间相邻的一个；对所述时间表征和所述第一行为描述信息对应的初始行为表征进行融合，获得所述第一行为描述信息对应的行为表征；基于各行为描述信息对应的行为表征，获得所述第一用户对应的行为表征序列。5.根据权利要求4所述的方法，所述利用所述特征提取层，对第一用户的样本行为序列中的各行为描述信息进行特征提取，获得所述第一用户对应的初始行为表征序列，包括：提取所述第一行为描述信息中的数字字符；对所述数字字符进行离散化处理，得到所述数字字符的初始表征，并对非数字字符进行编码，得到所述非数字字符的初始表征；基于所述数字字符和非数字字符的初始表征，确定所述第一行为描述信息对应的初始行为表征；基于各行为描述信息对应的初始行为表征，获得所述第一用户对应的初始行为表征序列。6.根据权利要求3
‑
5中任一项所述的方法，所述对所述第一用户在预设时间段内对应
的用户表征进行融合，得到所述第一用户在所述预设时间段的用户表征，包括：对所述第一用户在预设时间段内对应的用户表征进行自注意力计算，得到所述第一用户在所述预设时间段的用户表征。7.根据权利要求6所述的方法，所述第一用户在预设时间段内对应的用户表征符合预设分布规律；所述对所述第一用户在预设时间段内对应的用户表征进行自注意力计算，得到所述第一...

【专利技术属性】
技术研发人员：陶学文，李少帅，王斌锋，刘爽，刘小雷，马琼旭，
申请(专利权)人：浙江网商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人