项目推荐方法、装置及系统制造方法及图纸

技术编号:29254393 阅读:17 留言:0更新日期:2021-07-13 17:25
公开了一种项目推荐方法、装置及系统。离线模型模块为候选项目集中的候选项目得到第一分值;反馈统计模块统计分析用户对候选项目的反馈,得到该候选项目的第二分值;决策模块基于第一分值和第二分值得到第三分值,并基于第三分值从所述多个候选项目中选择中选项目,以用于向用户推荐。由此,通过离线在线混合策略及置信区间上界算法,充分利用历史数据训练得到的模型分数,大大降低探索流量,实时接收用户反馈,快速捕捉用户兴趣及需求,高精度地应对用户特征的变化,向用户推荐优选项目。

【技术实现步骤摘要】
项目推荐方法、装置及系统
本公开涉及互联网领域,特别是涉及一种互联网领域的项目推荐方法、装置和系统。
技术介绍
随着互联网的飞速发展,尤其是移动互联网的发展,推荐系统发挥着越来越重要的作用。在现有的推荐方法中,有一部分场景的需求是从候选集中选取一个优选的结果推荐给用户,例如,电子商务场景中为用户推荐一个优选的商品,或者在多个WiFi热点中选一个优选的结果推荐给用户。然而,在这些应用场景中,现有的推荐方法要么缺乏在线探索过程,易于因历史数据偏差导致模型效果差,要么在线探索时需要消耗大量流量影响用户的体验。此外,现有推荐方法的应用场景中,需要在候选项目中选取优选项目以满足至少一个指标最大化。例如,在商品或视频推荐应用中,系统会从一个商品(或视频)候选项目集里选择一个优选的候选推荐给用户。这样,如何从一个拥有海量元素的候选项目集中选出优选的项目成为了非常重要的问题,这并不是简单的面向固定指标的排序问题,因为用户的兴趣或者需求会随时间变化,该变化的规律因不同用户而异。而只有高精度地通过用户的反馈来评估用户的兴趣或者需求的变化,才能够向用户推荐优选候选项目。因此,需要一种能够克服历史数据偏差,又能降低探索流量,并且能够高精度地反馈更新用户特征的变化的推荐方法。
技术实现思路
本公开要解决的一个技术问题是如何提供一种项目推荐方法,在节省在线探索流量的同时很好地克服历史数据偏差的缺陷。为此,本专利技术将离线模型与在线探索相结合,充分利用历史数据训练模型,实时接收用户反馈来评估用户兴趣或者需求的变化,以向用户推荐优选的项目。根据本公开的第一个方面,提供了一种项目推荐方法。该方法包括:获取使用模型为候选项目集中的候选项目得到的模型分数,确定第一分值;获取通过统计分析用户对候选项目集中的候选项目的反馈得到的第二分值;基于第一分值和第二分值得到第三分值;以及基于第三分值,从所述多个候选项目中选择中选项目。可选地,所述确定第一分值的步骤可以包括:分别基于至少一个模型中每个模型为候选项目得到的模型分数,得到该候选项目的至少一个第四分值;以及基于所述至少一个第四分值确定第一分值。可选地,基于所述至少一个第四分值确定第一分值的步骤可以包括:选择所述至少一个第四分值中的一个作为第一分值;或者通过对所述至少一个第四分值进行加权求和得到第一分值。可选地,基于所述至少一个第四分值确定第一分值的步骤可以包括:选择多个第四分值中最大的一个作为第一分值。可选地,第四分值可以是基于置信区间上界算法得到的;并且/或者第二分值可以是基于置信区间上界算法得到的。可选地,第四分值可以是模型本轮次对候选项目的评分与模型评分置信区间半径之和,模型评分置信区间可以是基于包括本轮次评分在内的模型对候选项目的历来各轮次评分统计计算的。可选地,第二分值可以是本轮次对候选项目多次推荐的平均收益与多次推荐收益的置信区间半径之和。可选地,所述基于第一分值和第二分值得到第三分值的步骤可以包括:以第一分值和第二分值中较小的一个作为第三分值;或者通过对第一分值和第二分值进行加权求和得到第三分值。可选地,该方法还可以包括:使用历史数据训练所述模型;以及/或者使用用户对候选项目集中的候选项目的反馈训练所述模型。可选地,该方法还可以包括:从数据库中获取多个候选项目;以及在所述多个候选项目的数量大于阈值的情况下,对所述多个候选项目进行初步筛选,得到所述候选项目集。可选地,在当前时刻之前预定时间段内,用户对候选项目集中的候选项目的反馈数量多于预定阈值的情况下,停止执行确定第一分值的步骤。可选地,该方法还可以包括:响应于设置请求,设置预定时间段的长度和/或预定阈值。可选地,该方法还可以包括:向当前要向其推送项目的用户推荐中选项目。根据本公开的第二个方面,提供了一种闲置商品推荐方法,包括:获取使用模型为候选商品集中的候选商品得到的模型分数,确定第一分值;获取通过统计分析用户对候选商品集中的候选商品的反馈得到的第二分值;基于第一分值和第二分值得到第三分值;以及基于第三分值,从多个候选商品中选择中选商品;以及向当前要向其推送商品的用户推荐中选商品。根据本公开的第三个方面,提供了一种视频推荐方法,包括:获取使用模型为候选视频集中的候选视频得到的模型分数,确定第一分值;获取通过统计分析用户对候选视频集中的候选视频的反馈得到的第二分值;基于第一分值和第二分值得到第三分值;以及基于第三分值,从多个候选视频中选择中选视频;以及向当前要向其推送视频的用户推荐中选视频。根据本公开的第四个方面,提供了一种新闻推荐方法,包括:获取使用模型为候选新闻集中的候选新闻得到的模型分数,确定第一分值;获取通过统计分析用户对候选新闻集中的候选新闻的反馈得到的第二分值;基于第一分值和第二分值得到第三分值;以及基于第三分值,从多个候选新闻中选择中选新闻;以及向当前要向其推送新闻的用户推荐中选新闻。根据本公开的第五个方面,提供了一种项目推荐装置,该装置包括:第一装置,用于获取使用模型为候选项目集中的候选项目得到的模型分数,确定第一分值;第二装置,用于获取通过统计分析用户对候选项目集中的候选项目的反馈得到的第二分值;第三装置,用于基于第一分值和第二分值得到第三分值;以及选择装置,用于基于第三分值,从所述多个候选项目中选择中选项目。根据本公开的第六个方面,提供了一种项目推荐系统,该系统包括:离线模型模块,为候选项目集中的候选项目得到模型分数;反馈统计模块,统计分析用户对候选项目的反馈,得到该候选项目的第二分值;以及决策模块,基于模型分数得到该候选项目的第一分值,基于第一分值和第二分值得到第三分值,并基于第三分值从所述多个候选项目中选择中选项目,以用于向用户推荐。可选地,该系统还可以包括:项目召回模块,用于从数据库中获取多个候选项目,在所述多个候选项目的数量大于阈值的情况下,对所述多个候选项目进行初步筛选,得到所述候选项目集;以及/或者项目推荐模块,用于向用户推荐项目;以及/或者反馈收集模块,用于收集用户对所推荐项目的反馈。根据本公开的第七个方面,提供了一种项目推荐系统,包括服务器和多个客户端。其中,服务器向客户端推送候选项目集中的候选项目;客户端向服务器发送针对所述候选项目的反馈;服务器获取使用模型为候选项目集中的候选项目得到的模型分数,确定第一分值,获取通过统计分析来自客户端的对候选项目集中的候选项目的反馈得到的第二分值,基于第一分值和第二分值得到第三分值,并基于第三分值,从所述多个候选项目中选择中选项目,并向当前要向其推送项目的客户端推送所述中选项目。根据本公开的第八个方面,提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如上述第一至第四方面所述的方法。根据本公开的第九个方面,提供了一种非暂时性机器可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行如上述第本文档来自技高网...

【技术保护点】
1.一种项目推荐方法,包括:/n获取使用模型为候选项目集中的候选项目得到的模型分数,确定第一分值;/n获取通过统计分析用户对候选项目集中的候选项目的反馈得到的第二分值;/n基于第一分值和第二分值得到第三分值;以及/n基于第三分值,从所述多个候选项目中选择中选项目。/n

【技术特征摘要】
1.一种项目推荐方法,包括:
获取使用模型为候选项目集中的候选项目得到的模型分数,确定第一分值;
获取通过统计分析用户对候选项目集中的候选项目的反馈得到的第二分值;
基于第一分值和第二分值得到第三分值;以及
基于第三分值,从所述多个候选项目中选择中选项目。


2.根据权利要求1所述的项目推荐方法,其中,所述确定第一分值的步骤包括:
分别基于至少一个模型中每个模型为候选项目得到的模型分数,得到该候选项目的至少一个第四分值;以及
基于所述至少一个第四分值确定第一分值。


3.根据权利要求2所述的项目推荐方法,其中,基于所述至少一个第四分值确定第一分值的步骤包括:
选择所述至少一个第四分值中的一个作为第一分值;或者
通过对所述至少一个第四分值进行加权求和得到第一分值。


4.根据权利要求2所述的项目推荐方法,其中,基于所述至少一个第四分值确定第一分值的步骤包括:
选择多个第四分值中最大的一个作为第一分值。


5.根据权利要求2所述的项目推荐方法,其中,
第四分值是基于置信区间上界算法得到的;并且/或者
第二分值是基于置信区间上界算法得到的。


6.根据权利要求5所述的项目推荐方法,其中,
第四分值是模型本轮次对候选项目的评分与模型评分置信区间半径之和,模型评分置信区间是基于包括本轮次评分在内的模型对候选项目的历来各轮次评分统计计算的;并且/或者
第二分值是本轮次对候选项目多次推荐的平均收益与多次推荐收益的置信区间半径之和。


7.根据权利要求1所述的项目推荐方法,其中,所述基于第一分值和第二分值得到第三分值的步骤包括:
以第一分值和第二分值中较小的一个作为第三分值;或者
通过对第一分值和第二分值进行加权求和得到第三分值。


8.根据权利要求1所述的项目推荐方法,还包括:
使用历史数据训练所述模型;以及/或者
使用用户对候选项目集中的候选项目的反馈训练所述模型。


9.根据权利要求1所述的项目推荐方法,还包括:
从数据库中获取多个候选项目;以及
在所述多个候选项目的数量大于阈值的情况下,对所述多个候选项目进行初步筛选,得到所述候选项目集。


10.根据权利要求1所述的项目推荐方法,其中,
在当前时刻之前预定时间段内,用户对候选项目集中的候选项目的反馈数量多于预定阈值的情况下,停止执行所述确定第一分值的步骤。


11.根据权利要求10所述的项目推荐方法,还包括:
响应于设置请求,设置所述预定时间段的长度和/或所述预定阈值。


12.根据权利要求1所述的项目推荐方法,还包括:
向当前要向其推送项目的用户推荐所述中选项目。


13.一种闲置商品推荐方法,包括:
获取使用模型为候选商品集中的候选商品得到的模型分数,确定第一分值;
获取通过统计分析用户对候选商品集中的候选商品的反馈得到的第二分值;
基于第一分值和第二分值得到第三分...

【专利技术属性】
技术研发人员:刘家豪谢淼彭艺李楠
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1