项目推荐方法、装置及系统制造方法及图纸

技术编号：29254393 阅读：17 留言：0更新日期：2021-07-13 17:25

公开了一种项目推荐方法、装置及系统。离线模型模块为候选项目集中的候选项目得到第一分值；反馈统计模块统计分析用户对候选项目的反馈，得到该候选项目的第二分值；决策模块基于第一分值和第二分值得到第三分值，并基于第三分值从所述多个候选项目中选择中选项目，以用于向用户推荐。由此，通过离线在线混合策略及置信区间上界算法，充分利用历史数据训练得到的模型分数，大大降低探索流量，实时接收用户反馈，快速捕捉用户兴趣及需求，高精度地应对用户特征的变化，向用户推荐优选项目。

全部详细技术资料下载

【技术实现步骤摘要】
项目推荐方法、装置及系统
本公开涉及互联网领域，特别是涉及一种互联网领域的项目推荐方法、装置和系统。
技术介绍
随着互联网的飞速发展，尤其是移动互联网的发展，推荐系统发挥着越来越重要的作用。在现有的推荐方法中，有一部分场景的需求是从候选集中选取一个优选的结果推荐给用户，例如，电子商务场景中为用户推荐一个优选的商品，或者在多个WiFi热点中选一个优选的结果推荐给用户。然而，在这些应用场景中，现有的推荐方法要么缺乏在线探索过程，易于因历史数据偏差导致模型效果差，要么在线探索时需要消耗大量流量影响用户的体验。此外，现有推荐方法的应用场景中，需要在候选项目中选取优选项目以满足至少一个指标最大化。例如，在商品或视频推荐应用中，系统会从一个商品(或视频)候选项目集里选择一个优选的候选推荐给用户。这样，如何从一个拥有海量元素的候选项目集中选出优选的项目成为了非常重要的问题，这并不是简单的面向固定指标的排序问题，因为用户的兴趣或者需求会随时间变化，该变化的规律因不同用户而异。而只有高精度地通过用户的反馈来评估用户的兴趣或者需求的变化，才能够向用户推荐优选候选项目。因此，需要一种能够克服历史数据偏差，又能降低探索流量，并且能够高精度地反馈更新用户特征的变化的推荐方法。
技术实现思路
本公开要解决的一个技术问题是如何提供一种项目推荐方法，在节省在线探索流量的同时很好地克服历史数据偏差的缺陷。为此，本专利技术将离线模型与在线探索相结合，充分利用历史数据训练模型，实时接收用户反馈来...

【技术保护点】
1.一种项目推荐方法，包括：/n获取使用模型为候选项目集中的候选项目得到的模型分数，确定第一分值；/n获取通过统计分析用户对候选项目集中的候选项目的反馈得到的第二分值；/n基于第一分值和第二分值得到第三分值；以及/n基于第三分值，从所述多个候选项目中选择中选项目。/n

【技术特征摘要】
1.一种项目推荐方法，包括：
获取使用模型为候选项目集中的候选项目得到的模型分数，确定第一分值；
获取通过统计分析用户对候选项目集中的候选项目的反馈得到的第二分值；
基于第一分值和第二分值得到第三分值；以及
基于第三分值，从所述多个候选项目中选择中选项目。

2.根据权利要求1所述的项目推荐方法，其中，所述确定第一分值的步骤包括：
分别基于至少一个模型中每个模型为候选项目得到的模型分数，得到该候选项目的至少一个第四分值；以及
基于所述至少一个第四分值确定第一分值。

3.根据权利要求2所述的项目推荐方法，其中，基于所述至少一个第四分值确定第一分值的步骤包括：
选择所述至少一个第四分值中的一个作为第一分值；或者
通过对所述至少一个第四分值进行加权求和得到第一分值。

4.根据权利要求2所述的项目推荐方法，其中，基于所述至少一个第四分值确定第一分值的步骤包括：
选择多个第四分值中最大的一个作为第一分值。

5.根据权利要求2所述的项目推荐方法，其中，
第四分值是基于置信区间上界算法得到的；并且/或者
第二分值是基于置信区间上界算法得到的。

6.根据权利要求5所述的项目推荐方法，其中，
第四分值是模型本轮次对候选项目的评分与模型评分置信区间半径之和，模型评分置信区间是基于包括本轮次评分在内的模型对候选项目的历来各轮次评分统计计算的；并且/或者
第二分值是本轮次对候选项目多次推荐的平均收益与多次推荐收益的置信区间半径之和。

7.根据权利要求1所述的项目推荐方法，其中，所述基于第一分值和第二分值得到第三分值的步骤包括：
以第一分值和第二分值中较小的一个作为第三分值；或者
通过对第一分值和第二分值进行加权求和得到第三分值。

8.根据权利要求1所述的项目推荐方法，还包括：
使用历史数据训练所述模型；以及/或者
使用用户对候选项目集中的候选项目的反馈训练所述模型。

9.根据权利要求1所述的项目推荐方法，还包括：
从数据库中获取多个候选项目；以及
在所述多个候选项目的数量大于阈值的情况下，对所述多个候选项目进行初步筛选，得到所述候选项目集。

10.根据权利要求1所述的项目推荐方法，其中，
在当前时刻之前预定时间段内，用户对候选项目集中的候选项目的反馈数量多于预定阈值的情况下，停止执行所述确定第一分值的步骤。

11.根据权利要求10所述的项目推荐方法，还包括：
响应于设置请求，设置所述预定时间段的长度和/或所述预定阈值。

12.根据权利要求1所述的项目推荐方法，还包括：
向当前要向其推送项目的用户推荐所述中选项目。

13.一种闲置商品推荐方法，包括：
获取使用模型为候选商品集中的候选商品得到的模型分数，确定第一分值；
获取通过统计分析用户对候选商品集中的候选商品的反馈得到的第二分值；
基于第一分值和第二分值得到第三分...

【专利技术属性】
技术研发人员：刘家豪，谢淼，彭艺，李楠，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人