物品推荐方法、系统、电子设备及存储介质技术方案

技术编号:24456498 阅读:23 留言:0更新日期:2020-06-10 15:42
本申请公开了物品推荐及模型训练方法、系统、电子设备及存储介质,涉及人工智能领域。具体实现方案为:采用预先训练的用户点击物品的任务模型和待推荐的物品库中各物品的至少两个特征信息,构建物品特征表达数据库;采用预先训练的用户点击物品的任务模型和用户的至少两个特征信息,获取用户的特征表达;根据用户的特征表达和物品特征表达数据库,获取要推荐的N个物品的标识;基于N个物品的标识,向用户推荐N个物品的相关信息。本申请的技术方案,通过预先训练好的用户点击物品的任务模型来实现物品推荐,能够有效地降低计算量,避免计算错误,提高推荐准确性。而且能够有效地提高物品推荐的智能性,提升物品推荐效率。

Recommended methods, systems, electronic equipment and storage media

【技术实现步骤摘要】
物品推荐方法、系统、电子设备及存储介质
本申请涉及计算机
,尤其涉及人工智能,具体涉及一种物品推荐及模型训练方法、系统、电子设备及存储介质。
技术介绍
互联网发展到今天,衍生出各种互联网产品,如电商之类的购物平台的出现,改变了人们的生活方式,增强了购物的便利性。在各种互联网应用产品中,用户可以自主选择自己感兴趣的物品,也可以由系统向用户推荐物品。例如,现有的物品推荐系统中,可以采用协同过滤推荐的方式。如业界常用的有基于物品的协同过滤推荐itemCF或者基于用户的协同过滤推荐userCF。itemCF使用两个物品之间共同感兴趣用户重合数量来衡量两个物品之间的相似度,再根据用户历史物品推荐相似的候选物品。userCF使用两个用户之间共同感兴趣的物品的重合数量来衡量两个用户之间的相似度,再根据相似用户群喜爱的物品对目标用户推荐候选物品。但是,在用户数量或者物品数量都较多的时候,上述推荐方案的计算量代价非常大,容易造成计算错误,导致推荐方案的物品推荐准确性较差。
技术实现思路
为了解决上述技术问题,本申请提供一种物品推荐及模型训练方法、系统、电子设备及存储介质,用于提高物品推荐的准确性。一方面,本申请提供一种物品推荐方法,包括:采用预先训练的用户点击物品的任务模型和待推荐的物品库中各物品的至少两个特征信息,构建物品特征表达数据库;采用所述预先训练的用户点击物品的任务模型和用户的至少两个特征信息,获取用户的特征表达;根据所述用户的特征表达和所述物品特征表达数据库,获取要推荐的N个物品的标识;基于所述N个物品的标识,向所述用户推荐所述N个物品的相关信息。进一步可选地,如上所述的方法中,根据所述用户的特征表达和所述物品特征表达数据库,获取要推荐的N个物品的标识,包括:在所述物品特征表达数据库中,检索出与所述用户的特征表达最相关的N个物品的特征表达;获取所述N个物品的特征表达对应的所述N个物品的标识。进一步可选地,如上所述的方法中,预先训练的所述用户点击物品的任务模型包括召回任务模块和点击率预估任务模块,且所述召回任务模块与所述点击率预估任务模块之间经过联合训练。另一方面,本申请还提供了一种用户点击物品的任务模型的训练方法,包括:采集数条训练数据,各所述训练数据中包括训练用户的至少两个训练特征信息、训练物品的至少两个训练特征信息以及所述训练用户对所述训练物品的点击交互信息;采用所述数条训练数据,对所述用户点击物品的任务模型中的召回任务模块和点击率预估任务模块进行联合训练。进一步可选地,如上所述的方法中,采用所述数条训练数据,对所述用户点击物品的任务模型中的召回任务模块和点击率预估任务模块进行联合训练,包括:对于各条所述训练数据,将所述训练用户的至少两个特征信息进行嵌入表达后拼接,得到训练用户的组合特征表达;将所述训练物品的至少两个训练特征信息进行嵌入表达后拼接,得到训练物品的组合特征表达;在所述召回任务模块中,将所述训练用户的组合特征表达和所述训练物品的组合特征表达分别经过至少两层包括全连接处理和激活处理的处理层的处理,得到训练用户的特征表达和训练物品的特征表达;在所述召回任务模块中,将所述训练用户的特征表达和所述训练物品的特征表达进行相乘,得到所述训练物品对所述训练用户的推荐程度指标;在所述点击率预估任务模块中,将所述训练用户的组合特征表达和所述训练物品的组合特征表达拼接,并依次经过至少两层包括全连接处理和激活处理的处理层、以及sigmoid激活函数处理层的处理,得到所述训练用户对所述训练物品的预测点击概率;基于所述训练物品对所述训练用户的推荐程度指标、所述训练用户对所述训练物品的预测点击概率、已知的所述训练用户对所述训练物品的点击交互信息,生成综合交叉熵损失函数;判断所述综合交叉熵损失函数是否收敛;若未收敛,调整所述用户点击物品的任务模型的参数;若收敛,判断是否在第一连续预设轮数的训练中均收敛;若是,确定所述用户点击物品的任务模型的参数,进而确定所述用户点击物品的任务模型。进一步可选地,如上所述的方法中,基于所述训练物品对所述训练用户的推荐程度指标、所述训练用户对所述训练物品的预测点击概率、已知的所述训练用户对所述训练物品的点击交互信息,生成综合交叉熵损失函数,包括:基于所述训练物品对所述训练用户的推荐程度指标和已知的所述训练用户对所述训练物品的点击交互信息,生成第一交叉熵函数;基于所述训练用户对所述训练物品的预测点击概率和已知的所述训练用户对所述训练物品的点击交互信息,生成第二交叉熵函数;取所述第一交叉熵函数和所述第二交叉熵函数之和,得到所述综合交叉熵损失函数。进一步可选地,如上所述的方法中,在确定所述综合交叉熵损失函数在所述第一连续预设轮数的训练中均收敛时,还包括:继续采用所述数条训练数据,训练所述召回任务模块,直至所述第一交叉熵函数在第二连续预设轮数的训练中均收敛,确定所述召回任务模块的参数,确定所述召回任务模块,进而确定所述用户点击物品的任务模型。再一方面,本申请还提供了一种物品推荐系统,包括:构建模块,用于采用预先训练的用户点击物品的任务模型和待推荐的物品库中各物品的至少两个特征信息,构建物品特征表达数据库;特征获取模块,用于采用所述预先训练的用户点击物品的任务模型和用户的至少两个特征信息,获取用户的特征表达;物品获取模块,用于根据所述用户的特征表达和所述物品特征表达数据库,获取要推荐的N个物品的标识;推荐模块,用于基于所述N个物品的标识,向所述用户推荐所述N个物品的相关信息。又一方面,本申请还提供了一种用户点击物品的任务模型的训练装置,包括:采集模块,用于采集数条训练数据,各所述训练数据中包括训练用户的至少两个训练特征信息、训练物品的至少两个训练特征信息以及所述训练用户对所述训练物品的点击交互信息;训练模块,用于采用所述数条训练数据,对所述用户点击物品的任务模型中的召回任务模块和点击率预估任务模块进行联合训练。再另一方面,本申请还提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上任一项所述的方法。再又一方面,本申请还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上任一项所述的方法。上述申请中的一个实施例具有如下优点或有益效果:通过采用预先训练的用户点击物品的任务模型和待推荐的物品库中各物品的至少两个特征信息,构建物品特征表达数据库;采用用户点击物品的任务模型和用户的至少两个特征信息,获取用户的特征表达;根据用户的特征表达和物品特征表达数据库,获取要推荐的N个物品的标识;基于N个物品的标识,本文档来自技高网...

【技术保护点】
1.一种物品推荐方法,其特征在于,包括:/n采用预先训练的用户点击物品的任务模型和待推荐的物品库中各物品的至少两个特征信息,构建物品特征表达数据库;/n采用所述预先训练的用户点击物品的任务模型和用户的至少两个特征信息,获取用户的特征表达;/n根据所述用户的特征表达和所述物品特征表达数据库,获取要推荐的N个物品的标识;/n基于所述N个物品的标识,向所述用户推荐所述N个物品的相关信息。/n

【技术特征摘要】
1.一种物品推荐方法,其特征在于,包括:
采用预先训练的用户点击物品的任务模型和待推荐的物品库中各物品的至少两个特征信息,构建物品特征表达数据库;
采用所述预先训练的用户点击物品的任务模型和用户的至少两个特征信息,获取用户的特征表达;
根据所述用户的特征表达和所述物品特征表达数据库,获取要推荐的N个物品的标识;
基于所述N个物品的标识,向所述用户推荐所述N个物品的相关信息。


2.根据权利要求1所述的方法,其特征在于,根据所述用户的特征表达和所述物品特征表达数据库,获取要推荐的N个物品的标识,包括:
在所述物品特征表达数据库中,检索出与所述用户的特征表达最相关的N个物品的特征表达;
获取所述N个物品的特征表达对应的所述N个物品的标识。


3.根据权利要求1或2所述的方法,其特征在于,预先训练的所述用户点击物品的任务模型包括召回任务模块和点击率预估任务模块,且所述召回任务模块与所述点击率预估任务模块之间经过联合训练。


4.一种用户点击物品的任务模型的训练方法,其特征在于,包括:
采集数条训练数据,各所述训练数据中包括训练用户的至少两个训练特征信息、训练物品的至少两个训练特征信息以及所述训练用户对所述训练物品的点击交互信息;
采用所述数条训练数据,对所述用户点击物品的任务模型中的召回任务模块和点击率预估任务模块进行联合训练。


5.根据权利要求4所述的方法,其特征在于,采用所述数条训练数据,对所述用户点击物品的任务模型中的召回任务模块和点击率预估任务模块进行联合训练,包括:
对于各条所述训练数据,将所述训练用户的至少两个特征信息进行嵌入表达后拼接,得到训练用户的组合特征表达;
将所述训练物品的至少两个训练特征信息进行嵌入表达后拼接,得到训练物品的组合特征表达;
在所述召回任务模块中,将所述训练用户的组合特征表达和所述训练物品的组合特征表达分别经过至少两层包括全连接处理和激活处理的处理层的处理,得到训练用户的特征表达和训练物品的特征表达;
在所述召回任务模块中,将所述训练用户的特征表达和所述训练物品的特征表达进行相乘,得到所述训练物品对所述训练用户的推荐程度指标;
在所述点击率预估任务模块中,将所述训练用户的组合特征表达和所述训练物品的组合特征表达拼接,并依次经过至少两层包括全连接处理和激活处理的处理层、以及sigmoid激活函数处理层的处理,得到所述训练用户对所述训练物品的预测点击概率;
基于所述训练物品对所述训练用户的推荐程度指标、所述训练用户对所述训练物品的预测点击概率、已知的所述训练用户对所述训练物品的点击交互信息,生成综合交叉熵损失函数;
判断所述综合交叉熵损失函数是否收敛;若未收敛,调整所述用户点击物品的任务模型的参数;
若收敛,判断是否在第一连续预设轮数的训练中均收敛;若是,确定所述用户点击物品的任务模型的参数,进而确定所述用户点击物品的任务模型。


6.根据权利要求5所述的方法,其特征在于,基于所述训练物品对所述训练用户的推荐程度指标、所述训练用户对所述训练物品的预测点击概率、已知的所述训练用户对所述训练物品的点击交互信息,生成综合交叉熵损失函数,包括:
基于所述训练物品对所述训练用户的推荐程度指标和已知的所述训练用户对所述训练物品的点击交互信息,生成第一交叉熵函数;
基于所述训练用户对所述训练物品的预测点击概率和已知的所述训练用户对所述训练物品的点击交互信息,生成第二交叉熵函数;
取所述第一交叉熵函数和所述第二交叉熵函数之和,得到所述综合交叉熵损失函数。


7.根据权利要求6所述的方法,其特征在于,在确定所述综合交叉熵损失函数在所述第一连续预设轮数的训练中均收敛时,所述方法还包括:
继续采用所述数条训练数据,训练所述召回任务模块,直至所述第一交叉熵函数在第二连续预设轮数的训练中均收敛,确定所述召回任务模块的参数,确定所述召回任务模块,进而确定所述用户点击物品的任务模型。


8.一种物品推荐系统,其特征在于,包括:
构建模块,用于采用预先训练的用户点击物品的任务模型和待推荐的物品库中各物品的至少两个特征信...

【专利技术属性】
技术研发人员:陈亮辉付琰王全斌杨晓璇彭炼钢
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1