一种基于类簇信息的探索性召回方法和装置制造方法及图纸

技术编号:38328511 阅读:11 留言:0更新日期:2023-07-29 09:11
本发明专利技术涉及推荐系统技术领域,提供了一种基于类簇信息的探索性召回方法和装置。其中方法包括:使用预先构建的神经网络模型进行训练,得到多个用户向量和多个物品向量;根据物品向量,对物品进行划分聚类得到多个类簇;根据目标用户的用户数据,从多个所述用户向量中找到对应的目标用户向量;根据目标用户向量,计算目标用户与各类簇之间的第一相似度,选择第一相似度靠前的第一预设数量个类簇作为目标类簇;从目标类簇中选择相应的物品进行召回。本发明专利技术在用户和物品的相似度计算之间引入了类簇,从而弱化了用户兴趣相关性,强化了用户兴趣的探索性,且类簇还初步缩小了候选物品集合的范围,在一定程度上解决相关性计算的耗时问题。时问题。时问题。

【技术实现步骤摘要】
一种基于类簇信息的探索性召回方法和装置


[0001]本专利技术涉及推荐系统
,特别是涉及一种基于类簇信息的探索性召回方法和装置。

技术介绍

[0002]随着全球信息技术的迅猛发展,信息数据呈现出爆发式增长的趋势,大量的数据中蕴含了巨大的价值,但是同时也带来了“信息过载”的问题。对于用户来说,如何从海量的知识里面找到自己所需要的信息,是推荐系统要解决的问题。推荐系统作为一个连接用户和物品的桥梁,在很多领域得到了应用。如应用在电子商务中,在电商平台中为用户提供个性化的商品,发掘用户潜在的需求;在短视频领域中,在短视频平台为用户推荐感兴趣的短视频,让有意义的人和事得到展现;为用户提供有趣的新闻推荐;还能够通过位置服务为用户提供周边详情,搭建起店铺和消费者连接的通道。推荐系统经过训练,使用收集的交互数据包括用户的决策、特征等了解用户的偏好,高度个性化地预测用户的兴趣和需求。
[0003]对于平台而言,推荐系统是提高站点的点击率、转化率等的工具,是公司获得用户增长、提升相关业务指标的有力手段。好的推荐系统总是能给用户推荐出想要的内容,让用户更加频繁地访问站点,增强用户粘度。从视频、商品、课程到音乐等,它们都可以促使消费者选择感兴趣的任何产品和服务,帮助公司达到相应的目的。推荐系统作为推动个性化用户体验以及娱乐、医疗、金融等行业强大的决策支持工具的关键组件,得到了各大公司的纷纷引入。
[0004]推荐系统的核心单元是推荐算法,推荐算法本质上是一种信息处理逻辑,获取了用户和用户的信息之后,按照一定的逻辑处理信息,产生推荐结果。一般分为以下几步,召回、粗排、精排、重排。召回作为推荐算法的第一个阶段,需要根据用户和商品的部分特征,从海量的物品库里,快速找回一小部分用户潜在感兴趣的内容,然后交给下面的排序环节,这部分需要处理的数据量非常大,速度要求快,因此策略、特征和模型都不能太复杂。
[0005]协同过滤(CF,Collaborative Filtering)是召回的传统算法,分为基于用户的协同过滤和基于物品的协同过滤方法。基于用户的协同过滤考虑的是用户和用户之间的相似度,找到相似用户喜欢的物品,并预测用户对这些物品的评分,就可以找到评分最高的若干个物品推荐给用户。基于物品的协同过滤方法是通过找到用户喜欢的物品,从而对相似度高的相似物品进行预测,将评分最高的若干个相似物品推荐给用户。无论是哪一种,都只是用到了ID类特征,用户的属性以及物品的其他属性等特征都没有用到,泛化能力较弱。另一方面,协同过滤是基于共现的召回,热门物品往往更容易能得到推送。
[0006]随着嵌入技术的发展,召回技术开始朝着模型化嵌入的方法演化。形式上讲,嵌入就是用一个低维稠密的向量,表达能力更强。通过对用户、物品的向量进行相似度计算之后按照相似度排序就可以得到想要召回的物品。目前基于嵌入的召回有U2I(用户到物品)、I2I(物品到物品)等。前者根据用户向量和物品向量,计算出二者的相似度,然后进行召回;后者根据用户历史行为序列的物品向量,计算物品向量之间的相似度,检索相似度最高地n
个物品。但是这一类方法的相关性比较强,都是极大地在消费用户的兴趣,对用户兴趣的探索度不够,同时在物品集合很大的情况下,相似度的计算也会增加整个算法的计算耗时。
[0007]鉴于此,克服该现有技术所存在的缺陷是本
亟待解决的问题。

技术实现思路

[0008]本专利技术要解决的技术问题是现有的召回方法相关性较强,导致用户兴趣的探索性不够。
[0009]本专利技术采用如下技术方案:
[0010]第一方面,本专利技术提供了一种基于类簇信息的探索性召回方法,包括:
[0011]使用预先构建的神经网络模型进行训练,得到多个用户向量和多个物品向量;
[0012]根据物品向量,对物品进行划分聚类得到多个类簇;
[0013]根据目标用户的用户数据,从多个所述用户向量中找到对应的目标用户向量;
[0014]根据目标用户向量,计算目标用户与各类簇之间的第一相似度,选择第一相似度靠前的第一预设数量个类簇作为目标类簇;
[0015]从目标类簇中选择相应的物品进行召回。
[0016]优选的,所述从目标类簇中选择相应的物品进行召回,具体包括:
[0017]从每个所述目标类簇中选取排列靠前的第二预设数量个物品作为候选物品,计算所述目标用户向量与各候选物品向量之间的第二相似度,对第二相似度满足预设条件的候选物品进行召回。
[0018]优选的,所述根据物品向量,对物品进行划分聚类得到多个类簇,包括:
[0019]根据物品向量和各类簇的划分前中心点,将各物品划分至各类簇;
[0020]每进行一次划分,根据上一次划分的结果,重新计算各类簇的划分后中心点,若存在至少一个类簇的划分后中心点与划分前中心点之间的变化大于预设值,则进行下一次划分,直至每一类簇的划分后中心点与对应划分前中心点之间的变化不大于预设值;
[0021]其中,以上一次的划分后中心点作为下一次的划分前中心点,在进行第一次划分时,按照预设规则,建立第三预设数量个类簇,并确定各类簇的划分前中心点。
[0022]优选的,所述根据物品向量和各类簇的划分前中心点,将各物品划分至各类簇,具体包括:
[0023]针对每一个物品向量,计算物品向量与各类簇的划分前中心点之间的向量内积,根据向量内积确定物品向量与各类簇的划分前中心点之间的距离;
[0024]将物品划分至距离最近的类簇中。
[0025]优选的,所述根据目标用户的用户数据,从多个所述用户向量中找到对应的目标用户向量,具体包括:
[0026]根据目标用户的用户数据中的目标用户特征,在所述多个用户向量中,找到具有目标用户特征的用户向量,即为目标用户向量。
[0027]优选的,所述根据目标用户向量,计算目标用户与各类簇之间的第一相似度,具体包括:
[0028]计算类簇中所有物品向量的平均值,得到类簇向量;
[0029]计算目标用户向量与类簇向量之间的向量内积,得到目标用户向量与对应类簇之
间的第一相似度。
[0030]优选的,所述使用预先构建的神经网络模型进行训练,得到多个用户向量和多个物品向量,具体包括:
[0031]以用户数据、物品数据以及用户物品关系数据作为输入,进行神经网络模型的训练,从所述神经网络模型的最后一层中提取得到多个用户特征嵌入向量和物品特征嵌入向量;
[0032]将每一类用户所对应的多个用户特征嵌入向量累加得到对应的用户向量;
[0033]将每一类物品所对应的多个物品特征嵌入向量累加得到对应的物品向量。
[0034]优选的,所述进行神经网络模型的训练,具体包括:
[0035]根据神经网络模型的预测结果和用户物品关系数据中的实际结果,使用交叉熵损失优化分类器,计算得到交叉熵损失;
[0036]根据所述交叉熵损失,对所述神经网络模型进行迭代优化。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于类簇信息的探索性召回方法,其特征在于,包括:使用预先构建的神经网络模型进行训练,得到多个用户向量和多个物品向量;根据物品向量,对物品进行划分聚类得到多个类簇;根据目标用户的用户数据,从多个所述用户向量中找到对应的目标用户向量;根据目标用户向量,计算目标用户与各类簇之间的第一相似度,选择第一相似度靠前的第一预设数量个类簇作为目标类簇;从目标类簇中选择相应的物品进行召回。2.根据权利要求1所述的基于类簇信息的探索性召回方法,其特征在于,所述从目标类簇中选择相应的物品进行召回,具体包括:从每个所述目标类簇中选取排列靠前的第二预设数量个物品作为候选物品,计算所述目标用户向量与各候选物品向量之间的第二相似度,对第二相似度满足预设条件的候选物品进行召回。3.根据权利要求1所述的基于类簇信息的探索性召回方法,其特征在于,所述根据物品向量,对物品进行划分聚类得到多个类簇,包括:根据物品向量和各类簇的划分前中心点,将各物品划分至各类簇;每进行一次划分,根据上一次划分的结果,重新计算各类簇的划分后中心点,若存在至少一个类簇的划分后中心点与划分前中心点之间的变化大于预设值,则进行下一次划分,直至每一类簇的划分后中心点与对应划分前中心点之间的变化不大于预设值;其中,以上一次的划分后中心点作为下一次的划分前中心点,在进行第一次划分时,按照预设规则,建立第三预设数量个类簇,并确定各类簇的划分前中心点。4.根据权利要求权利要求3所述的基于类簇信息的探索性召回方法,其特征在于,所述根据物品向量和各类簇的划分前中心点,将各物品划分至各类簇,具体包括:针对每一个物品向量,计算物品向量与各类簇的划分前中心点之间的向量内积,根据向量内积确定物品向量与各类簇的划分前中心点之间的距离;将物品划分至距离最近的类簇中。5.根据权利要求权利要求1所述的基于类簇信息的探索性召回方法,其特征在于,所述根据目标用户的用户数据,从多个所述用户向量中找到对应的目标用户向...

【专利技术属性】
技术研发人员:赵倩黄关李天杰
申请(专利权)人:中国船舶集团有限公司第七〇九研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1