一种推荐模型的训练方法及装置制造方法及图纸

技术编号:37228933 阅读:57 留言:0更新日期:2023-04-20 23:11
本公开涉及人工智能技术领域,提供了一种推荐模型的训练方法、装置、计算机设备及计算机可读存储介质。该方法能够充分利用海量的用户历史交互序列,充分挖掘不同历史交互特征信息之间潜在的语义关联,且能规避推荐场景中正负样本比例悬殊的问题,这样,便可以提升推荐模型对于推荐对象、交互结果的预测评估的训练的精度,从而可以进一步提升推荐模型在稀疏推荐场景中的泛化性能,以及,可以提升推荐模型对于推荐对象、交互结果的预测评估的精确度,进而可以提高推荐对象的转化率以及用户体验。进而可以提高推荐对象的转化率以及用户体验。进而可以提高推荐对象的转化率以及用户体验。

【技术实现步骤摘要】
一种推荐模型的训练方法及装置


[0001]本公开涉及人工智能
,尤其涉及一种推荐模型的训练方法及装置。

技术介绍

[0002]在互联网电子商务业务中,如何根据用户的个性化特征,向用户推荐合适的商品或服务一直是一个重要课题。在某些相对低频场景下,如线上广告、线上租房、买房等,由于正样本数据(比如点击,购买)的稀疏性,基于用户线上行为所构造的序列推荐模型,会由于序列本身的长度较短,且前后关联性差等问题,导致在序列推荐模型的训练过程中,会由于序列的表征特征中的信息不足,出现模型过拟合、泛化能力弱的问题,这样,会使得利用序列推荐模型向用户推荐商品或服务的场景下,给用户所推荐的商品或服务并不是用户真正想要的商品或服务,从而导致用户体验较差,且在提高商品或服务的转化率上有一定的局限性。

技术实现思路

[0003]有鉴于此,本公开实施例提供了一种推荐模型的训练方法、装置、计算机设备及计算机可读存储介质,以解决现有技术中基于用户线上行为所构造的序列推荐模型,会由于序列本身的长度较短,且前后关联性差等问题,导致在序列推荐模型的训练过程中,会由于序列的表征特征中的信息不足,出现模型过拟合、泛化能力弱的问题,这样,会使得利用序列推荐模型向用户推荐商品或服务的场景下,给用户所推荐的商品或服务并不是用户真正想要的商品或服务,从而导致用户体验较差,且在提高商品或服务的转化率上有一定的局限性的问题。
[0004]本公开实施例的第一方面,提供了一种推荐模型的训练方法,所述方法包括:
[0005]利用推荐模型,得到所述第一交互训练样本中第一历史交互序列对应的预测交互特征信息;其中,所述第一历史交互序列包括若干历史交互特征信息;
[0006]根据所述预测交互特征信息,以及所述第一交互训练样本中与所述第一历史交互序列对应的真实交互特征信息,对所述推荐模型的模型参数进行调整,得到调整后的推荐模型;
[0007]利用所述调整后的推荐模型,得到所述第二交互训练样本中第二历史交互序列对应的预测交互结果;其中,所述第二历史交互序列包括若干历史交互特征信息;
[0008]根据所述预测交互结果,以及所述第二交互训练样本中与所述第二历史交互序列对应的真实交互结果,对所述调整后的推荐模型的模型参数进行调整,得到目标推荐模型。
[0009]本公开实施例的第二方面,提供了一种推荐模型的训练装置,所述装置包括:
[0010]第一预测单元,用于利用推荐模型,得到所述第一交互训练样本中第一历史交互序列对应的预测交互特征信息;其中,所述第一历史交互序列包括若干历史交互特征信息;
[0011]第一调整单元,用于根据所述预测交互特征信息,以及所述第一交互训练样本中与所述第一历史交互序列对应的真实交互特征信息,对所述推荐模型的模型参数进行调
整,得到调整后的推荐模型;
[0012]第二预测单元,用于利用所述调整后的推荐模型,得到所述第二交互训练样本中第二历史交互序列对应的预测交互结果;其中,所述第二历史交互序列包括若干历史交互特征信息;
[0013]第二调整单元,用于根据所述预测交互结果,以及所述第二交互训练样本中与所述第二历史交互序列对应的真实交互结果,对所述调整后的推荐模型的模型参数进行调整,得到目标推荐模型。
[0014]本公开实施例的第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0015]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0016]本公开实施例与现有技术相比存在的有益效果是:本公开实施例可以先利用推荐模型,得到所述第一交互训练样本中第一历史交互序列对应的预测交互特征信息;其中,所述第一历史交互序列包括若干历史交互特征信息。然后,可以根据所述预测交互特征信息,以及所述第一交互训练样本中与所述第一历史交互序列对应的真实交互特征信息,对所述推荐模型的模型参数进行调整,得到调整后的推荐模型。接着,可以利用所述调整后的推荐模型,得到所述第二交互训练样本中第二历史交互序列对应的预测交互结果;其中,所述第二历史交互序列包括若干历史交互特征信息。最后,可以根据所述预测交互结果,以及所述第二交互训练样本中与所述第二历史交互序列对应的真实交互结果,对所述调整后的推荐模型的模型参数进行调整,得到目标推荐模型。可见,本实施例中,可以先利用第一交互训练样本中第一历史交互序列,使推荐模型可以基于用户交互序列(即第一历史交互序列)进行建模,以便推荐模型可以提取出交互序列中的丰富信息且动态的语义表征信息,从而可以提高推荐模型的推荐精准度;然后,可以利用第二交互训练样本中第二历史交互序列与所述第二历史交互序列对应的真实交互结果,对推荐模型进行调优,以便可以提高推荐模型对于交互结果的评估的精准度。这样,可以能够充分利用海量的用户历史交互序列,充分挖掘不同历史交互特征信息之间潜在的语义关联,且能规避推荐场景中正负样本比例悬殊的问题,这样,便可以提升推荐模型对于推荐对象、交互结果的预测评估的训练的精度,从而可以进一步提升推荐模型在稀疏推荐场景中的泛化性能,以及,可以提升推荐模型对于推荐对象、交互结果的预测评估的精确度,进而可以提高推荐对象的转化率以及用户体验。
附图说明
[0017]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0018]图1是本公开实施例的应用场景的场景示意图;
[0019]图2是本公开实施例提供的推荐模型的训练方法的流程图;
[0020]图3是本公开实施例提供的确定预测交互特征信息的模型训练流程示意图;
[0021]图4是本公开实施例提供的确定预测交互结果的模型训练流程示意图;
[0022]图5是本公开实施例提供的推荐模型的训练装置的框图;
[0023]图6是本公开实施例提供的计算机设备的示意图。
具体实施方式
[0024]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0025]下面将结合附图详细说明根据本公开实施例的一种推荐模型的训练方法和装置。
[0026]在现有技术中,由于传统的推荐模型的训练方法,在某些相对低频场景下,如线上广告、线上租房、买房等,由于正样本数据(比如点击,购买)的稀疏性,基于用户线上行为所构造的序列推荐模型,会由于序列本身的长度较本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐模型的训练方法,其特征在于,所述方法包括:利用推荐模型,得到所述第一交互训练样本中第一历史交互序列对应的预测交互特征信息;其中,所述第一历史交互序列包括若干历史交互特征信息;根据所述预测交互特征信息,以及所述第一交互训练样本中与所述第一历史交互序列对应的真实交互特征信息,对所述推荐模型的模型参数进行调整,得到调整后的推荐模型;利用所述调整后的推荐模型,得到所述第二交互训练样本中第二历史交互序列对应的预测交互结果;其中,所述第二历史交互序列包括若干历史交互特征信息;根据所述预测交互结果,以及所述第二交互训练样本中与所述第二历史交互序列对应的真实交互结果,对所述调整后的推荐模型的模型参数进行调整,得到目标推荐模型。2.根据权利要求1所述的方法,其特征在于,所述历史交互特征信息包括交互对象属性特征、历史交互行为特征和交互用户属性特征。3.根据权利要求2所述的方法,其特征在于,所述第一历史交互序列和所述第二历史交互序列中的每个历史交互特征信息的交互用户属性特征均为相同的。4.根据权利要求1所述的方法,其特征在于,所述预测交互特征信息包括预测交互对象属性特征、预测交互行为特征和预测交互用户属性特征;所述真实交互特征信息包括真实交互对象属性特征、真实交互行为特征和真实交互用户属性特征。5.根据权利要求4所述的方法,其特征在于,所述推荐模型包括神经网络编码器和神经网络解码器;所述利用推荐模型,得到所述第一交互训练样本中第一历史交互序列对应的预测交互特征信息,包括:将所述第一交互训练样本中第一历史交互序列输入所述神经网络编码器,得到所述第一历史交互序列中每个历史交互特征信息各自分别对应的编码表征特征;将所述第一历史交互序列中所有历史交互特征信息各自分别对应的编码表征特征输入所述神经网络解码器,得到所述第一历史交互序列对应的第一预测解码表征向量;针对第i

1预测解码表征向量,将所述第一历史交互序列中所有历史交互特征信息各自分别对应的编码表征特征,以及所述第一预测解码表征向量至第i

1预测解码表征向量全部输入所述神经网络解码器,得到第i预测解码表征向量;其中,i为大于1的正整数;将所述第i预测解码表征向量分别输入交互对象属性特征分类器、交互行为特征分类器和交互用户属性特征分类器,得到所述预测交互对象属性特征、所述预测交互行为特征和所述预测交互用户属性特征。6.根据权利要求1所述的方法,其特征在于,所述根据所述预测交互特征信息,以及所述第一交互训练样本中与所述第一历史交互序列对应的真实交互特征信息,对所述推荐模型的模型参数进行调整,得到调整...

【专利技术属性】
技术研发人员:暴宇健董辉
申请(专利权)人:北京龙智数科科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1