【技术实现步骤摘要】
【国外来华专利技术】具有自适应阈值的邻域选择推荐系统
[0001]本专利申请要求2021年2月8日提交的专利技术名称为“具有自适应阈值的邻域选择推荐系统(RECOMMENDATION SYSTEM WITH ADAPTIVE THRESHOLDS FOR NEIGHBORHOOD SELECTION)”的第17/170,647号美国专利申请的优先权权益,所述美国专利申请通过引用结合在本申请中,就像完整复制一样。
[0002]本专利技术大体上涉及使用机器学习技术处理基于图的数据,特别是在推荐系统的上下文中。
技术介绍
[0003]信息过滤系统是一种从提供给人类用户的信息流中删除冗余或不需要的信息以管理信息过载的系统。推荐系统(recommendation system,RS)是信息过滤系统的子类,试图预测用户对项目的评级或偏好。RS通常用于商业应用,以引导用户从大量潜在候选者中找到他们的真正兴趣。
[0004]个性化RS在许多在线服务中发挥着重要作用。个性化RS的任务是为每个前向用户提供项目的排名列表。准确的个性化RS可以使用户以及内容发布者和平台提供商受益。RS用于各种商业领域,以向用户提供个性化推荐,包括例如:为流处理和下载内容提供商平台提供视频或音乐建议;为在线零售商平台提供产品建议;为应用商店平台提供应用建议;为社交媒体平台提供内容建议;为移动新闻应用程序或在线新闻网站建议新闻文章。
[0005]RS通常采用协同过滤(collaborative filtering,CF)和基于内容的过滤中的一种或两种。这两 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于处理输入数据集的推荐系统中的计算机实现方法,所述输入数据集标识用户集、项目集和关于所述用户集中的用户与所述项目集中的项目之间的历史交互的用户
‑
项目交互数据,其特征在于,所述计算机实现方法包括:根据所述用户
‑
项目交互数据,生成指示所述用户集中用户对的用户
‑
用户相似性分数的用户
‑
用户相似性数据集;根据所述用户
‑
项目交互数据,生成指示所述项目集中项目对的项目
‑
项目相似性分数的项目
‑
项目相似性数据集;根据用户相似性阈值矢量过滤所述用户
‑
用户相似性数据集,以生成过滤的用户
‑
用户相似性数据集,所述用户相似性阈值矢量包括所述用户集中每个用户的相应用户相似性阈值;根据所述过滤的用户
‑
用户相似性数据集和用户嵌入集,生成用户邻居嵌入集,所述用户嵌入集包括所述用户集中每个用户的相应用户嵌入;根据项目相似性阈值矢量过滤所述项目
‑
项目相似性数据集,以生成过滤的项目
‑
项目相似性数据集,所述项目相似性阈值矢量包括所述项目集中每个项目的相应项目相似性阈值;根据所述过滤的项目
‑
项目相似性数据集和项目嵌入集,生成项目邻居嵌入集,所述项目嵌入集包括所述项目集中每个项目的相应项目嵌入;根据所述用户邻居嵌入和所述项目邻居嵌入,生成相关性分数集,对于用户集中的每个用户,所述相关性分数集包括所述项目集中的所述项目的相应相关性分数;根据所述相关性分数集,为每个用户生成一个或多个推荐项目的列表。2.根据权利要求1所述的方法,其特征在于,所述方法还包括共同学习所述用户相似性阈值矢量、所述用户嵌入集、所述项目相似性阈值矢量和所述项目嵌入集。3.根据权利要求2所述的方法,其特征在于,共同学习包括进行双层优化过程,所述双层优化过程包括用于根据下层目标函数学习所述用户嵌入和项目嵌入的内部优化阶段和用于根据上层目标函数学习所述用户相似性阈值矢量和项目相似性阈值矢量的外部优化阶段。4.根据权利要求3所述的方法,其特征在于,进行所述双层优化过程包括计算所述用户嵌入和所述项目嵌入的代理嵌入,并在所述外部优化阶段期间使用所述代理嵌入。5.根据权利要求3所述的方法,其特征在于:用于学习所述用户嵌入和项目嵌入的所述内部优化阶段包括:(a)根据临时用户相似性阈值矢量过滤所述用户
‑
用户相似性数据集,以生成临时过滤的用户
‑
用户相似性数据集;(b)根据临时项目相似性阈值矢量过滤所述项目
‑
项目相似性数据集,以生成临时过滤的项目
‑
项目相似性数据集;(c)根据所述临时过滤的用户
‑
用户相似性数据集和临时用户嵌入集,生成临时用户邻居嵌入集;(d)根据所述临时过滤的项目
‑
项目相似性数据集和临时项目嵌入集,生成临时项目邻居嵌入集;(e)根据所述临时用户邻居嵌入和所述临时项目邻居嵌入,生成临时相关性分数集;
(f)根据生成临时相关性分数集来确定损失;(g)更新所述临时用户嵌入集和临时项目嵌入集,以使所述损失最小化;重复(c)到(g),直到所述临时用户嵌入集和临时项目嵌入集相对于所述临时用户相似性阈值矢量和临时项目阈值矢量得到优化;并且用于学习所述用户相似性阈值矢量和所述项目相似性阈值矢量的所述外部优化阶段包括:(h)根据临时用户相似性阈值矢量过滤所述用户
‑
用户相似性数据集,以生成临时过滤的用户
‑
用户相似性数据集;(i)根据临时项目相似性阈值矢量过滤所述项目
‑
项目相似性数据集,以生成临时过滤的项目
‑
项目相似性数据集;(j)根据所述临时过滤的用户
‑
用户相似性数据集和代理用户嵌入集,生成临时用户邻居嵌入集;(k)根据所述临时过滤的项目
‑
项目相似性数据集和代理项目嵌入集,生成临时项目邻居嵌入集;(l)根据所述临时用户邻居嵌入和所述临时项目邻居嵌入,生成临时相关性分数集;(m)根据生成临时相关性分数集来确定所述损失;(n)更新所述临时用户相似性阈值矢量和临时项目相似性阈值矢量,以使所述损失最小化;重复(h)到(n),直到所述临时用户相似性阈值矢量和临时项目相似性阈值矢量相对于所述代理用户嵌入集和所述代理项目嵌入集得到优化,其中,在多个训练迭代期间,依次重复所述内部优化阶段和所述外部优化阶段。6.根据权利要求2所述的方法,其特征在于,共同学习包括:根据所述输入数据集确定多个三元组,其中每个三元组标识:(i)来自所述用户集的相应用户;(ii)所述项目集中根据所述用户
‑
项目交互数据被认为相对于所述相应用户为正反馈的正反馈项目;(iii)所述项目集中根据所述用户
‑
项目交互数据被认为相对于所述相应用户为负反馈的负反馈项目;学习所述用户相似性阈值矢量、所述用户嵌入集、所述项目相似性阈值矢量和所述项目嵌入集以优化目标,对于所述多个三元组,所述目标使针对相对于用户的正反馈项目计算的相关性分数与针对相对于用户的负反馈项目计算的相关性分数之间的差最大化。7.根据权利要求1至6中任一项所述的方法,其特征在于:使用余弦相似性算法确定所述用户对的所述用户
‑
用户相似性分数和所述项目对的所述项目
‑
项目相似性分数。8.根据权利要求1至7中任一项所述的方法,其特征在于:过滤所述用户
‑
用户相似性数据集包括,对于每个用户:在所述过滤的用户
‑
用户相似性数据集中复制所述用户
‑
用户相似性数据集中超过所述用户的所述相应用户相似性阈值的所述用户的所述用户
‑
用户相似性分数中的任何一个,在所述过滤的用户
‑
用户相似性数据集中将所述用户
‑
用户相似性数据集中不超过所述用户的所述相应用户相似性阈值的所述用户的所述用户
‑
用户相似性分数中的任何一个
设置为零;并且过滤所述项目
‑
项目相似性数据集包括,对于每个项目:在所述过滤的项目
‑
项目相似性数据集中复制所述项目
‑
项目相似性数据集中超过所述项目的所述相应项目相似性阈值的所述项目的所述项目
‑
项目相似性分数中的任何一个,在所述过滤的项目
‑
项目相似性数据集中将所述项目
‑
项目相似性数据集中不超过所述项目的所述相应项目相似性阈值的所述项目的所述项目
‑
项目相似性分数中的任何一个设置为零。9.根据权利要求8所述的方法,其特征在于:生成所述用户邻居嵌入集包括确定所述过滤的用户
‑
用户相似性数据集的矩阵表示和所述用户嵌入集的矩阵表示的点积;生成所述项目邻居嵌入集包括确定所述过滤的项目
‑
项目相似性数据集的矩阵表示和所述项目嵌入集的矩阵表示的点积。10.根据权利要求9所述的方法,其特征在于,生成所述相关性分数集包括确定所述用户邻居嵌入集的矩阵表示和所述项目邻居嵌入集的矩阵表示的点积。11.一种用于处理输入数据集的推荐系统,所述输入数据集标识用户集、项目集和关于所述用户集中的用户与所述项目集中的项目之间的历史交互的用户
‑
项目交互数据,其特征在于,所述推荐系统包括:处理设备;非瞬时性存储设备,耦合到所述处理设备并存储指令,当由所述处理设备执行时,所述指令将所述推荐系统用于:根据所述用户
‑
项目交互数据,生成指示所述用户集中用户对的用户
‑
用户相似性分数的用户
‑
用户相似性数据...
【专利技术属性】
技术研发人员:吴浩伦,马辰,张莹雪,马克,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。