一种模型训练以及点击率预估方法及装置制造方法及图纸

技术编号:28978997 阅读:18 留言:0更新日期:2021-06-23 09:25
本说明书公开了一种模型训练以及点击率预估方法及装置,通过根据用户信息、产品信息、用户历史行为构建多模态知识图谱的结构,以及确定该多模态知识图谱内各节点的基础特征,并根据该多模态知识图谱的结构以及图谱内各节点的基础特征,确定各节点的增强特征,进而确定图谱中各用户节点与各产品节点的增强表示,以确定由用户节点的图谱表示和产品节点的图谱表示构成的各训练样本,以及样本标签,并根据标签及预测结果对该点击率预估模型进行训练。基于多模态知识图谱,确定用户节点和产品节点的图谱表示,得到训练样本和样本标签,使得训练出的点击率预估模型,可基于该图谱中的各条知识进行点击率预估,提高了模型的预测准确率。

【技术实现步骤摘要】
一种模型训练以及点击率预估方法及装置
本说明书涉及计算机
,尤其涉及一种模型训练以及点击率预估方法及装置。
技术介绍
目前,随着计算机技术的发展,如何从海量信息中选择有价值的信息,从而为用户推荐合适的产品,已经成为服务提供方需要解决的问题之一。而点击率预估模型因为能够基于用户的历史行为以及产品特性为用户推荐合适的产品的特性,被广泛应用于服务提供方为用户提供服务的场景中。在现有技术中,一种常用的点击率预估方法是将用户的用户信息、用户的历史行为信息、以及产品的产品信息进行特征提取,并将提取出来的用户特征、用户的历史行为特征,以及产品特征作为输入,输入到预先训练好的基于深度学习的点击率预估模型中,由该点击率预估模型确定出该用户对于该产品的点击率。但是,在缺少用户信息以及用户的历史行为信息的情况下,如,冷启动场景中,现有技术无法准确地确定出产品的点击率,因此,为了提高点击率预估的准确度,亟需一种改进的点击率预估方法。
技术实现思路
本说明书提供模型训练以及点击率预估方法及装置,以部分的解决现有技术存在的上述问题。本说明书采用下述技术方案:本说明书提供的点击率预估模型的训练方法,包括:根据各用户的用户信息、各产品的产品信息,以及各用户的历史行为,确定多模态知识图谱的结构,所述多模态知识图谱中至少包括用户节点以及产品节点;根据各用户的用户信息以及各产品的产品信息,通过待训练的点击率预估模型的图谱表示模块的编码器,确定所述多模态知识图谱中各节点的基础特征;<br>根据所述多模态知识图谱中各节点的基础特征以及所述多模态知识图谱的结构,确定各节点的增强特征,其中,所述节点的增强特征可根据所述节点的相邻节点的基础特征确定;根据所述多模态知识图谱的结构、各节点的基础特征以及增强特征,分别确定各用户节点的图谱表示以及各产品节点的图谱表示;确定由用户节点的图谱表示和产品节点的图谱表示构成的各训练样本,并根据用户历史行为,确定各训练样本的标签;将各训练样本作为输入,输入待训练的点击率预估模型的预测模块,并根据所述预测模块的预测结果以及各训练样本的标签,确定损失函数,并以损失函数最小为优化目标调整所述预测模块的参数,训练完成的所述点击率预估模型用于对用户点击产品的概率进行预测。可选地,根据各用户的用户信息、各产品的产品信息,以及各用户的历史行为,确定多模态知识图谱的结构,具体包括:根据各用户的用户信息,以及各产品的产品信息,确定所述多模态知识图谱的各节点;根据各用户的用户信息、各产品的产品信息、各用户的历史行为,确定所述多模态知识图谱中的各节点的关联关系;根据所述多模态知识图谱的各节点,以及所述多模态知识图谱中的各节点的关联关系,确定所述多模态知识图谱的结构。可选地,根据各用户的用户信息以及各产品的产品信息,通过待训练的点击率预估模型的图谱表示模块的编码器,确定所述多模态知识图谱中各节点的基础特征,具体包括:根据各用户的用户信息和各产品的产品信息,确定所述多模态知识图谱中各节点的节点信息;针对所述多模态知识图谱中的每个节点,根据该节点在所述多模态知识图谱中对应的模态,通过待训练的点击率预估模型的图谱表示模块的编码器,确定该节点对应的编码规则;根据确定出的编码规则,对该节点的节点信息进行编码,并将编码结果作为该节点的基础特征。可选地,根据所述多模态知识图谱中各节点的基础特征以及所述多模态知识图谱的结构,确定各节点的增强特征,具体包括:针对所述多模态知识图谱中的每个节点,根据多模态知识图谱的结构,确定该节点的相邻节点,所述相邻节点为多模态知识图谱中的与该节点具有关联关系的节点;根据该节点的相邻节点的基础特征确定该节点的增强特征。可选地,根据所述多模态知识图谱中各节点的基础特征以及所述多模态知识图谱的结构,确定各节点的增强特征,具体包括:针对所述多模态知识图谱中的每个节点,根据预设的步长范围,从所述多模态知识图谱中,确定该节点的距离在所述步长范围内的其他节点,作为相邻节点;根据各相邻节点的关联关系以及各相邻节点的基础特征,确定所述步长范围内,不同步长的相邻节点对该节点的增强特征。可选地,根据所述多模态知识图谱的结构、各节点的基础特征以及增强特征,分别确定各用户节点的图谱表示以及各产品节点的图谱表示,具体包括:针对所述多模态知识图谱中的每个用户节点,根据预设的步长范围,将该节点的基础特征分别与不同步长的相邻节点对该节点的增强特征进行合并,将合并后的特征进行拼接,并将拼接结果作为该用户节点的图谱表示;针对所述多模态知识图谱中的每个产品节点,根据预设的步长范围,将该节点的基础特征分别与不同步长的相邻节点对该节点的增强特征进行合并,将合并后的特征进行拼接,并将拼接结果作为该产品节点的图谱表示。可选地,所述方法还包括:随机确定所述多模态知识图谱中的多组具有关联关系的节点,将确定出来的各组节点与各组节点的关联关系作为各训练样本;将各训练样本作为输入,输入待训练的点击率预估模型的图谱表示模块,并根据所述图谱表示结果,以及各训练样本中包含的关联关系,确定图谱损失函数,并以损失函数最小为优化目标调整所述图谱表示模块的参数,训练完成的所述点击率预估模型的图谱表示模块用于对所述多模态知识图谱中的各节点进行图谱表示。本说明书还提供一种点击率预估方法,包括:获取用户的用户信息与产品的产品信息;将所述用户信息、所述产品信息作为输入,输入到训练好的点击率预估模型的图谱表示模块,确定用户信息对应的用户节点的图谱表示以及产品信息对应的产品节点的图谱表示;所述图谱表示根据多模态知识图谱的结构、各节点的基础特征以及增强特征确定;所述多模态知识图谱的结构由各用户的用户信息、各产品的产品信息,以及各用户的历史行为确定;各节点的基础特征由各用户的用户信息、各产品的产品信息,通过待训练的点击率预估模型的图谱表示模块的编码器确定;各节点的增强特征根据所述多模态知识图谱中各节点的基础特征,以及所述多模态知识图谱的结构确定;将所述用户节点的图谱表示以及所述产品节点的图谱表示作为输入,输入到所述点击率预估模型的预测模块,确定所述产品的点击率,所述点击率用于为所述用户进行业务处理,其中,所述预测模块是基于所述多模态知识图谱中各节点图谱表示训练完成的。本说明书提供的计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现任一上述的点击率预估模型的训练方法或点击率预估方法。本说明书提供的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一上述的点击率预估模型的训练方法或点击率预估方法。本说明书采用的上述至少一个技术方案能够达到以下有益效果:在本说明书提供的点击率预估模型的训练方法中,通过根据用户信息、产品信息、用户历史行为构建多模态知识图谱的结构本文档来自技高网...

【技术保护点】
1.一种点击率预估模型的训练方法,其特征在于,所述方法包括:/n根据各用户的用户信息、各产品的产品信息,以及各用户的历史行为,确定多模态知识图谱的结构,所述多模态知识图谱中至少包括用户节点以及产品节点;/n根据各用户的用户信息以及各产品的产品信息,通过待训练的点击率预估模型的图谱表示模块的编码器,确定所述多模态知识图谱中各节点的基础特征;/n根据所述多模态知识图谱中各节点的基础特征以及所述多模态知识图谱的结构,确定各节点的增强特征,其中,所述节点的增强特征可根据所述节点的相邻节点的基础特征确定;/n根据所述多模态知识图谱的结构、各节点的基础特征以及增强特征,分别确定各用户节点的图谱表示以及各产品节点的图谱表示;/n确定由用户节点的图谱表示和产品节点的图谱表示构成的各训练样本,并根据用户历史行为,确定各训练样本的标签;/n将各训练样本作为输入,输入待训练的点击率预估模型的预测模块,并根据所述预测模块的预测结果以及各训练样本的标签,确定损失函数,并以损失函数最小为优化目标调整所述预测模块的参数,训练完成的所述点击率预估模型用于对用户点击产品的概率进行预测。/n

【技术特征摘要】
1.一种点击率预估模型的训练方法,其特征在于,所述方法包括:
根据各用户的用户信息、各产品的产品信息,以及各用户的历史行为,确定多模态知识图谱的结构,所述多模态知识图谱中至少包括用户节点以及产品节点;
根据各用户的用户信息以及各产品的产品信息,通过待训练的点击率预估模型的图谱表示模块的编码器,确定所述多模态知识图谱中各节点的基础特征;
根据所述多模态知识图谱中各节点的基础特征以及所述多模态知识图谱的结构,确定各节点的增强特征,其中,所述节点的增强特征可根据所述节点的相邻节点的基础特征确定;
根据所述多模态知识图谱的结构、各节点的基础特征以及增强特征,分别确定各用户节点的图谱表示以及各产品节点的图谱表示;
确定由用户节点的图谱表示和产品节点的图谱表示构成的各训练样本,并根据用户历史行为,确定各训练样本的标签;
将各训练样本作为输入,输入待训练的点击率预估模型的预测模块,并根据所述预测模块的预测结果以及各训练样本的标签,确定损失函数,并以损失函数最小为优化目标调整所述预测模块的参数,训练完成的所述点击率预估模型用于对用户点击产品的概率进行预测。


2.如权利要求1所述的方法,其特征在于,根据各用户的用户信息、各产品的产品信息,以及各用户的历史行为,确定多模态知识图谱的结构,具体包括:
根据各用户的用户信息,以及各产品的产品信息,确定所述多模态知识图谱的各节点;
根据各用户的用户信息、各产品的产品信息、各用户的历史行为,确定所述多模态知识图谱中的各节点的关联关系;
根据所述多模态知识图谱的各节点,以及所述多模态知识图谱中的各节点的关联关系,确定所述多模态知识图谱的结构。


3.如权利要求1所述的方法,其特征在于,根据各用户的用户信息以及各产品的产品信息,通过待训练的点击率预估模型的图谱表示模块的编码器,确定所述多模态知识图谱中各节点的基础特征,具体包括:
根据各用户的用户信息和各产品的产品信息,确定所述多模态知识图谱中各节点的节点信息;
针对所述多模态知识图谱中的每个节点,根据该节点在所述多模态知识图谱中对应的模态,通过待训练的点击率预估模型的图谱表示模块的编码器,确定该节点对应的编码规则;
根据确定出的编码规则,对该节点的节点信息进行编码,并将编码结果作为该节点的基础特征。


4.如权利要求2所述的方法,其特征在于,根据所述多模态知识图谱中各节点的基础特征以及所述多模态知识图谱的结构,确定各节点的增强特征,具体包括:
针对所述多模态知识图谱中的每个节点,根据多模态知识图谱的结构,确定该节点的相邻节点,所述相邻节点为多模态知识图谱中的与该节点具有关联关系的节点;
根据该节点的相邻节点的基础特征确定该节点的增强特征。


5.如权利要求2所述的方法,其特征在于,根据所述多模态知识图谱中各节点的基础特征以及所述多模态知识图谱的结构,确定各节点的增强特征,具体包括:
针对所述多模态知识图谱中的每个节点,根据预设的步长范围,从所述多模态知识图谱中,确定该节点的距离在所述步长范围内的其他节点,作为相邻节点;
根据各相邻节点的关联关系以及各相邻节点的基础特征,确定所述步长范围内,不同步长的相邻节点对该节点的增强特征。


6.如权利要求4或5所述的方法,其特征在于,根据所述多模态知识图谱的结构、各节点的基础特征以及增强特征,分别确定各用户节点的图谱表示以及各产品节点的图谱表示,具体包括:
针对所述多模态知识图谱中的每个用户节点,根据预设的步长范围,将该节点的基础特征分别与不同步长的相邻节点对该节点的增强特征进行合并,将合并后的特征进行拼接,并将拼接结果作为该用户节点的图谱表示;
针对所述多模态知识图谱中的每个产品节点,根据预设的步长范围,将该节点的基础特征分别与不同步长的相邻节点对该节点的增强特征进行合并,将合并后的特征进行拼接,并将拼接结果作为该产品节点的图谱表示。


7.如权利要求2所述的方法,其特征在于,所述方法还包括:
随机确定所述多模态知识图谱中的多组具有关联关系的节点,将确定出来的各组节点与各组节点的关联关系...

【专利技术属性】
技术研发人员:曹雪智张富峥
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1