【技术实现步骤摘要】
模型获取方法、用户处理方法、装置及电子设备
本专利技术属于网络
,特别是涉及一种模型获取方法、用户处理方法、装置及电子设备。
技术介绍
目前,经常需要获取模型,以对用户进行各种各样的处理。例如,获取信用评估模型以对用户进行信用评估,获取下单率预测模型以对用户进行下单率预测,等等。在获取模型时往往需要使用训练数据进行训练,但是训练数据中可能会包括对样本用户的覆盖度不同的多个主题的数据。因此,如何使用多个主题的数据获取模型,成为人们广泛关注的问题。现有技术中,往往是使用不同主题的数据分别获取对应的子模型,然后,基于这多个子模型获取最终的模型。这种方式中,训练过程较为繁琐,且由于拆分训练了多个子模型,会导致后续需要同时维护多个模型,维护成本较高。
技术实现思路
本专利技术提供一种模型获取方法、用户处理方法、装置及电子设备,以便解决训练过程较为繁琐,维护成本较高的问题。第一方面,本专利技术提供一种模型获取方法,所述方法包括:将训练数据输入待训练模型;所述训练数据包括样本用户对应的多种 ...
【技术保护点】
1.一种模型获取方法,其特征在于,所述方法包括:/n将训练数据输入待训练模型;所述训练数据包括样本用户对应的多种子训练数据,不同子训练数据对应不同的主题;/n基于所述待训练模型中包括的第一自注意力层,根据各个所述子训练数据的特征表示,确定各个所述子训练数据对应的主题权重;/n根据各个所述子训练数据的特征表示以及对应的主题权重,获取所述训练数据的特征表示;/n根据所述训练数据的特征表示对所述待训练模型进行训练,以获取用户处理模型。/n
【技术特征摘要】
1.一种模型获取方法,其特征在于,所述方法包括:
将训练数据输入待训练模型;所述训练数据包括样本用户对应的多种子训练数据,不同子训练数据对应不同的主题;
基于所述待训练模型中包括的第一自注意力层,根据各个所述子训练数据的特征表示,确定各个所述子训练数据对应的主题权重;
根据各个所述子训练数据的特征表示以及对应的主题权重,获取所述训练数据的特征表示;
根据所述训练数据的特征表示对所述待训练模型进行训练,以获取用户处理模型。
2.根据要求1所述的方法,其特征在于,所述方法还包括:
确定各个所述子训练数据的数据生成时刻距离当前时刻的目标时长;
根据各个所述子训练数据的目标时长,确定各个所述子训练数据的新鲜度权重;其中,所述新鲜度权重与所述目标时长正相关;
所述根据各个所述子训练数据的特征表示以及对应的主题权重,获取所述训练数据的特征表示,包括:
根据各个所述子训练数据的特征表示、对应的主题权重以及新鲜度权重,获取所述训练数据的特征表示。
3.根据要求2所述的方法,其特征在于,所述待训练模型中还包括第二自注意力层;所述根据各个所述子训练数据的目标时长,确定各个所述子训练数据的新鲜度权重,包括:
对于任一所述子训练数据,利用所述第二自注意力层,将所述目标时长作为预设新鲜度权重公式的输入,并将所述预设新鲜度权重公式的输出作为所述子训练数据的新鲜度权重;
其中,所述预设新鲜度权重公式中包括目标系数,所述目标系数为所述第二自注意力层中的参数。
4.根据要求2所述的方法,其特征在于,所述根据各个所述子训练数据的特征表示、对应的主题权重以及新鲜度权重,获取所述训练数据的特征表示,包括:
对于任一所述子训练数据,计算所述子训练数据的特征表示与所述子训练数据对应的主题权重之间的第一乘积;
计算所述第一乘积与所述子训练数据的新鲜度权重之间的第二乘积;
对各个所述子训练数据的第二乘积进行拼接,得到所述训练数据的特征表示。
5.根据要求1所述的方法,其特征在于,所述待训练模型还包括全连接层;所述根据各个所述子训练数据的特征表示以及对应的主题权重,获取所述训练数据的特征表示之前,所述方法还包括:
对任一所述样本用户的各个所述子训练数据进行向量化,以获取各个所述子训练数据的初始特征表示;
利用所述全连接层将各个所述子训练数据的初始特征表示映射至指定维数,得到各个所述子训练数据的特征表示。
6.根据要求1至5任一所述的方法,其特征在于,所述基于所述待训练模型中包括的第一自注意力层,根据各个所述子训练数据的特征表示,确定各个所述子训练数据对应的主题权重,包括:
对于任一所述子训练数据,基于所述第一自注意力层确定所述特征表示中各维特征对应的自注意力权重;
根据各维特征以及各维特征对应的自注意力权重,计算所述子训练数据对应的特征加权和;
根据各个所述子训练数据对应的特征加权和,确定各个所述子训练数据对应的主题权重。...
【专利技术属性】
技术研发人员:熊涛,江曼,洪星芸,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。