用户表征模型的训练方法、用户表征方法及装置制造方法及图纸

技术编号:36080436 阅读:14 留言:0更新日期:2022-12-24 10:53
本说明书实施例提供用户表征模型的训练方法、用户表征方法及装置,其中所述用户表征模型的训练方法包括:获取多个用户的样本行为序列,其中,任一用户的样本行为序列包括该用户在不同时间的行为描述信息;根据述用户的样本行为序列,利用预设机器学习网络,获得各所述用户在不同时间的用户表征,并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度;基于第一相似度和第二相似度,对预设机器学习网络进行训练,直至达到训练停止条件,获得用户表征模型。通过该种方式训练得到的用户表征模型效果更好,确定的用户表征能够更加准确合理地表征用户属性。户属性。户属性。

【技术实现步骤摘要】
用户表征模型的训练方法、用户表征方法及装置


[0001]本说明书实施例涉及机器学习
,特别涉及一种用户表征模型的训练方法、用户表征方法。

技术介绍

[0002]随着信息技术的发展,越来越多的用户服务都通过互联网等各种网络平台提供给用户,而用户在各种网络平台产生的行为能够在一定程度上反映用户的习惯、偏好等个人属性,因此,为了给用户带来更好的服务体验,可以基于用户的行为序列建模得到用户表征模型,根据该用户表征模型确定用户表征,以基于该用户表征为用户提供各项服务。
[0003]但通过目前的行为序列建模方式得到的用户表征模型,其仅能学习到用户的行为表征,导致确定的用户表征仅能表征用户的行为,无法准确地表征用户属性。因此,亟需一种训练方法来训练用户表征模型,使得该模型输出的用户表征能够准确地表征用户属性。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种用户表征模型的训练方法。本说明书一个或者多个实施例同时涉及一种用户表征方法,一种用户表征模型的训练装置,一种用户表征装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种用户表征模型的训练方法,包括:
[0006]获取多个用户的样本行为序列,其中,任一用户的样本行为序列包括该用户在不同时间的行为描述信息;
[0007]根据各所述用户的样本行为序列,利用预设机器学习网络,获得各所述用户在不同时间的用户表征,并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度;
[0008]基于所述第一相似度和第二相似度,对所述预设机器学习网络进行训练,直至达到训练停止条件,获得用户表征模型。
[0009]根据本说明书实施例的第二方面,提供了一种用户表征方法,包括:
[0010]获取目标用户的行为描述信息;
[0011]将所述行为描述信息输入用户表征模型,获得所述目标用户的用户表征,其中,所述用户表征模型通过上述第一方面所述的方法训练得到。
[0012]根据本说明书实施例的第三方面,提供了一种用户表征模型的训练装置,包括:
[0013]第一获取模块,被配置为获取多个用户的样本行为序列,其中,任一用户的样本行为序列包括该用户在不同时间的行为描述信息;
[0014]计算模块,被配置为根据各所述用户的样本行为序列,利用预设机器学习网络,获得各所述用户在不同时间的用户表征,并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度;
[0015]训练模块,被配置为基于所述第一相似度和第二相似度,对所述预设机器学习网络进行训练,直至达到训练停止条件,获得用户表征模型。
[0016]根据本说明书实施例的第四方面,提供了一种用户表征装置,包括:
[0017]第二获取模块,被配置为获取目标用户的行为描述信息;
[0018]获得模块,被配置为将所述行为描述信息输入用户表征模型,获得所述目标用户的用户表征,其中,所述用户表征模型通过上述第一方面所述的方法训练得到。
[0019]根据本说明书实施例的第五方面,提供了一种计算设备,包括:
[0020]存储器和处理器;
[0021]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述用户表征模型的训练方法或用户表征方法的步骤。
[0022]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述用户表征模型的训练方法或用户表征方法的步骤。
[0023]根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述用户表征模型的训练方法或用户表征方法的步骤。
[0024]本说明书一个实施例获取多个用户的样本行为序列,其中,任一用户的样本行为序列包括该用户在不同时间的行为描述信息;根据各所述用户的样本行为序列,利用预设机器学习网络,获得各所述用户在不同时间的用户表征,并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度;基于所述第一相似度和第二相似度,对所述预设机器学习网络进行训练,直至达到训练停止条件,获得用户表征模型。即在训练用户表征模型的过程中,根据样本行为序列确定用户表征之后,通过计算相同的用户在不同时间的用户表征之间的相似度,以及不同用户的用户表征之间的相似度来对用户表征模型的参数进行调整,使得该用户表征模型能够达到确定的相同用户在不同时间的用户表征比较接近,确定的不同用户的用户表征差距比较大的效果,因此,基于该用户表征模型确定的用户表征能够更加准确合理地表征用户属性,即训练得到的用户表征模型效果更好。
附图说明
[0025]图1是根据本说明书一个实施例提供的一种用户表征系统架构下用户表征模型的训练方法、用户表征方法的流程示意图;
[0026]图2是根据本说明书一个实施例提供的一种用户表征模型的训练方法的流程图;
[0027]图3是根据本说明书一个实施例提供的一种用户表征模型的训练方法的数据流向图;
[0028]图4是根据本说明书一个实施例提供的一种用户表征模型的训练方法的处理过程流程图;
[0029]图5是根据本说明书一个实施例提供的另一种用户表征模型的训练方法的数据流向图;
[0030]图6是根据本说明书一个实施例提供的一种用户表征方法的流程图;
[0031]图7是根据本说明书一个实施例提供的一种用户表征模型的训练装置的结构示意图;
[0032]图8是根据本说明书一个实施例提供的一种用户表征装置的结构示意图;
[0033]图9是根据本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0034]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0035]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0036]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户表征模型的训练方法,包括:获取多个用户的样本行为序列,其中,任一用户的样本行为序列包括该用户在不同时间的行为描述信息;根据各所述用户的样本行为序列,利用预设机器学习网络,获得各所述用户在不同时间的用户表征,并计算同一用户在不同时间的用户表征间的第一相似度、以及不同用户的用户表征间的第二相似度;基于所述第一相似度和第二相似度,对所述预设机器学习网络进行训练,直至达到训练停止条件,获得用户表征模型。2.根据权利要求1所述的方法,所述根据各所述用户的样本行为序列,利用预设机器学习网络,获得各所述用户在不同时间的用户表征,包括:利用预设机器学习网络,基于第一用户的样本行为序列中的各行为描述信息,获得所述第一用户对应的行为表征序列,其中,所述第一用户是所述多个用户中的任一个;根据所述行为表征序列,确定所述第一用户在不同时间的用户表征。3.根据权利要求2所述的方法,在所述根据所述行为表征序列,确定所述第一用户在不同时间的用户表征之后,还包括:对所述第一用户在预设时间段内对应的用户表征进行融合,得到所述第一用户在所述预设时间段的用户表征。4.根据权利要求2所述的方法,所述预设机器学习网络包括特征提取层;所述利用预设机器学习网络,基于第一用户的样本行为序列中的各行为描述信息,获得所述第一用户对应的行为表征序列,包括:利用所述特征提取层,对第一用户的样本行为序列中的各行为描述信息进行特征提取,获得所述第一用户对应的初始行为表征序列,其中,所述初始行为表征序列中包括各行为描述信息对应的初始行为表征;确定第一行为描述信息与第二行为描述信息间的时间间隔,获得所述时间间隔的时间表征,其中,所述第一行为描述信息是所述样本行为序列中的任一个,所述第二行为描述信息是所述样本行为序列中与所述第一行为描述信息时间相邻的一个;对所述时间表征和所述第一行为描述信息对应的初始行为表征进行融合,获得所述第一行为描述信息对应的行为表征;基于各行为描述信息对应的行为表征,获得所述第一用户对应的行为表征序列。5.根据权利要求4所述的方法,所述利用所述特征提取层,对第一用户的样本行为序列中的各行为描述信息进行特征提取,获得所述第一用户对应的初始行为表征序列,包括:提取所述第一行为描述信息中的数字字符;对所述数字字符进行离散化处理,得到所述数字字符的初始表征,并对非数字字符进行编码,得到所述非数字字符的初始表征;基于所述数字字符和非数字字符的初始表征,确定所述第一行为描述信息对应的初始行为表征;基于各行为描述信息对应的初始行为表征,获得所述第一用户对应的初始行为表征序列。6.根据权利要求3

5中任一项所述的方法,所述对所述第一用户在预设时间段内对应
的用户表征进行融合,得到所述第一用户在所述预设时间段的用户表征,包括:对所述第一用户在预设时间段内对应的用户表征进行自注意力计算,得到所述第一用户在所述预设时间段的用户表征。7.根据权利要求6所述的方法,所述第一用户在预设时间段内对应的用户表征符合预设分布规律;所述对所述第一用户在预设时间段内对应的用户表征进行自注意力计算,得到所述第一...

【专利技术属性】
技术研发人员:陶学文李少帅王斌锋刘爽刘小雷马琼旭
申请(专利权)人:浙江网商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1