基于用户相似度的跨领域评分方法以及评分设备技术

技术编号:19059378 阅读:31 留言:0更新日期:2018-09-29 12:40
本申请实施例公开了一种基于用户相似度的跨领域评分方法以及评分设备,用于解决目标领域的潜在用户冷启动的问题。本申请实施例方法包括:获取目标领域的用户‑项目评分矩阵和辅助领域的用户‑项目评分矩阵,其中目标领域的用户包含于辅助领域的用户;根据辅助领域的用户‑项目评分矩阵计算得到辅助领域中各用户之间的相似度值;根据辅助领域中各用户之间的相似度值和目标领域的用户‑项目评分矩阵,计算辅助领域中各用户对目标领域中对应的目标项目的预测评分,目标项目为辅助领域中各用户在目标领域中未进行评分的项目。本申请实施例还提供了一种评分设备,用于解决目标领域的潜在用户冷启动的问题。

【技术实现步骤摘要】
基于用户相似度的跨领域评分方法以及评分设备
本专利技术涉及网络推荐
,尤其涉及一种基于用户相似度的跨领域评分方法以及评分设备。
技术介绍
在这个信息爆炸的时代,如何使用户快速高效地从浩瀚的数据海洋中获取所需信息变得越来越紧迫,因此个性化推荐系统被广泛用于帮助用户探索和发现新的有趣的内容。协同过滤是个性化推荐系统中一种常用的方法,且丰富的用户行为数据是协同过滤算法准确推荐的必要条件,然而,大部分实际使用的推荐系统都面临数据缺失的问题,数据缺失通常表现在数据稀疏和冷启动,其中数据稀疏是指单个用户只对海量项目中的一部分项目有行为,冷启动是指新注册用户的行为数据少,为解决目标领域数据稀疏和冷启动的问题,引入其他相关领域即辅助领域的数据来进行跨领域推荐,该辅助领域的共同特征是用户活跃度高,对辅助领域中的很多项目都有行为。依据相似的用户有相似的喜好,目标领域的项目和辅助领域的项目在某些特征上是相似的,那么目标领域和辅助领域的用户-评分矩阵也会有相似的用户-项目评分模式的原理,现有技术采用以下三个步骤:步骤1:基于辅助领域的用户-项目评分矩阵计算辅助领域的评分模式;步骤2:将该评分模式迁移到目标领域,填充目标领域稀疏的用户-项目评分矩阵;步骤3:基于填充后的目标领域用户-项目评分矩阵,使用协同过滤算法为用户推荐项目。现有技术通过从辅助领域得到的用户评分模式填充数据稀疏的目标领域的用户-项目评分矩阵,提高已经在目标领域中有行为数据的用户的推荐准确率。然而,对于只在辅助领域有行为数据而在目标领域没有行为数据的用户,即目标领域的潜在用户,现有技术所采用的迁移学习的方法,对该潜在用户的推荐并没有涉及,故没有解决目标领域潜在用户冷启动的问题。
技术实现思路
本申请实施例提供了一种基于用户相似度的跨领域评分方法以及评分设备,用于解决目标领域的潜在用户冷启动的问题。本申请实施例的第一方面提供一种基于用户相似度的跨领域评分方法,包括:从目标领域获取用户-项目评分矩阵并且从辅助领域获取用户-项目评分矩阵,所述目标领域的用户包含于所述辅助领域的用户;按照预置的方法计算所述辅助领域的用户-项目评分矩阵,得到所述辅助领域中各用户之间的相似度值;再根据所述辅助领域中各用户之间的相似度值和获取到的所述目标领域的用户-项目评分矩阵,计算所述辅助领域中各用户对所述目标领域中对应的所述辅助领域中各用户在所述目标领域中未进行评分的项目的预测评分。本申请实施例中,评分设备根据获得的辅助领域的用户-项目评分矩阵计算得到了辅助领域中各用户之间的相似度值,再根据该相似度值和目标领域的用户-项目评分矩阵计算了辅助领域中各用户在目标领域中未进行评分的项目,辅助领域的用户均为目标领域的潜在用户,即得到了目标领域的潜在用户对目标领域中未评分的项目的预测评分,本申请实施例解决了目标领域的潜在用户冷启动的问题。在一种可能的设计中,在本申请实施例第一方面的第一种实现方式中,当所述辅助领域包括一个子辅助领域时,所述按照预置的方法计算所述辅助领域的用户-项目评分矩阵,得到所述辅助领域中各用户之间的相似度值包括:按照如下方式计算所述辅助领域中各用户之间的相似度值:或,所述sim(i,j)表示所述辅助领域中用户i和用户j之间的相似度值;所述ri,a表示所述辅助领域中用户i对项目a的评分;所述rj,a表示所述辅助领域中用户j对所述项目a的评分;所述表示所述辅助领域中用户i对所有项目的评分的平均值;所述表示所述辅助领域中用户j对所有项目的评分的平均值;所述I表示所述辅助领域中项目的集合。该实现方式中,当辅助领域仅包括一个领域时,给出了计算辅助领域中各用户之间的相似度值的方式,使本申请实施例更加具有可操作性。在一种可能的设计中,在本申请实施例第一方面的第二种实现方式中,当所述辅助领域包括多个子辅助领域时,所述根据所述辅助领域的用户-项目评分矩阵计算得到所述辅助领域中各用户之间的相似度值包括:按照预置的方法计算所述各子辅助领域的用户-项目评分矩阵,得到所述各子辅助领域中各用户之间的相似度值;将所述辅助领域中所有子辅助领域的用户-项目评分矩阵进行整合得到整合的用户-项目评分矩阵,按照预置的方法根据所述整合的用户-项目评分矩阵计算得到所述整合的用户-项目评分矩阵中各用户之间的相似度值;或者,还可以根据所述各子辅助领域的用户-项目评分矩阵计算出所述各子辅助领域中各用户之间的相似度值,然后根据所述各子辅助领域与所述目标领域的相似性权重系数,以及所述各子辅助领域中各用户之间的相似度值,计算所述各子辅助领域之间用户的相似度值。该实现方式中,当辅助领域包括多个子辅助领域时,将各子辅助领域整合为一个整合的用户-项目评分矩阵,再计算该矩阵中各用户之间的相似度值,考虑了辅助领域包括多个子辅助领域时的情况,使本申请实施例逻辑更加完善。在一种可能的设计中,在本申请实施例第一方面的第三种实现方式中,所述根据所述各子辅助领域与所述目标领域的相似性权重系数,以及所述各子辅助领域中各用户之间的相似度值,计算所述各子辅助领域之间用户的相似度值包括:按照如下方式计算所述各子辅助领域之间用户的相似度值:所述D表示所述多个子辅助领域的集合;所述wd表示子辅助领域d与所述目标领域的相似性权重系数;所述(si,j)d表示根据所述子辅助领域d的用户-项目评分矩阵计算得到的用户i和用户j的相似度值。该实现方式中,当辅助领域仅包括多个子辅助领域时,给出了计算整合的用户-项目评分矩阵中各用户之间的相似度值的方式,使本申请实施例更加具有可操作性。在一种可能的设计中,在本申请实施例第一方面的第四种实现方式中,所述根据所述辅助领域中各用户之间的相似度值和所述目标领域的用户-项目评分矩阵计算所述辅助领域中各用户对所述目标领域中目标项目的预测评分包括:根据所述辅助领域中各用户之间的相似度值确定所述辅助领域中各用户的相似用户;根据所述辅助领域中各用户与对应的相似用户之间的相似度值,以及所述目标领域的用户-项目评分矩阵,计算所述辅助领域中各用户对所述目标领域中目标项目的预测评分。该实现方式中,给出了计算根据辅助领域中各用户之间的相似度值和目标领域的用户-项目评分矩阵计算辅助领域中各用户对目标领域中目标项目的预测评分的方式,使本申请实施例更加具有可操作性。在一种可能的设计中,在本申请实施例第一方面的第五种实现方式中,所述根据所述辅助领域中各用户之间的相似度值确定所述辅助领域中各用户的相似用户包括:基于所述辅助领域中各用户之间的相似度值,确定得到与第一用户的相似度值大于第一预设值的用户集合,所述第一用户为所述辅助领域中的用户;按照相似度值从大到小的顺序从所述用户集合中确定预置数目个用户作为所述第一用户的相似用户。该实现方式中,先得到与第一用户的相似度值大于第一预设值的用户集合,再按照相似度值从大到小的顺序从用户集合中确定预置数目个用户作为第一用户的相似用户,增加了本申请实施例的实现方式。在一种可能的设计中,在本申请实施例第一方面的第六种实现方式中,所述根据所述辅助领域中各用户与对应的相似用户之间的相似度值,以及所述目标领域的用户-项目评分矩阵,计算所述辅助领域中各用户对所述目标领域中目标项目的预测评分包括:按照如下方式计算所述辅助领域中各用户对本文档来自技高网
...

【技术保护点】
1.一种基于用户相似度的跨领域评分方法,其特征在于,包括:获取目标领域的用户‑项目评分矩阵和辅助领域的用户‑项目评分矩阵,所述目标领域的用户包含于所述辅助领域的用户;根据所述辅助领域的用户‑项目评分矩阵计算得到所述辅助领域中各用户之间的相似度值;根据所述辅助领域中各用户之间的相似度值和所述目标领域的用户‑项目评分矩阵,计算所述辅助领域中各用户对所述目标领域中对应的目标项目的预测评分,所述目标项目为所述辅助领域中各用户在所述目标领域中未进行评分的项目。

【技术特征摘要】
1.一种基于用户相似度的跨领域评分方法,其特征在于,包括:获取目标领域的用户-项目评分矩阵和辅助领域的用户-项目评分矩阵,所述目标领域的用户包含于所述辅助领域的用户;根据所述辅助领域的用户-项目评分矩阵计算得到所述辅助领域中各用户之间的相似度值;根据所述辅助领域中各用户之间的相似度值和所述目标领域的用户-项目评分矩阵,计算所述辅助领域中各用户对所述目标领域中对应的目标项目的预测评分,所述目标项目为所述辅助领域中各用户在所述目标领域中未进行评分的项目。2.根据权利要求1所述的方法,其特征在于,当所述辅助领域包括一个子辅助领域时,所述根据所述辅助领域的用户-项目评分矩阵计算得到所述辅助领域中各用户之间的相似度值包括:按照如下方式计算所述辅助领域中各用户之间的相似度值:或,所述sim(i,j)表示所述辅助领域中用户i和用户j之间的相似度值;所述ri,a表示所述辅助领域中用户i对项目a的评分;所述rj,a表示所述辅助领域中用户j对所述项目a的评分;所述表示所述辅助领域中用户i对所有项目的评分的平均值;所述表示所述辅助领域中用户j对所有项目的评分的平均值;所述I表示所述辅助领域中项目的集合。3.根据权利要求1所述的方法,其特征在于,当所述辅助领域包括多个子辅助领域时,所述根据所述辅助领域的用户-项目评分矩阵计算得到所述辅助领域中各用户之间的相似度值包括:将所述辅助领域中所有子辅助领域的用户-项目评分矩阵进行整合得到整合的用户-项目评分矩阵;根据所述整合的用户-项目评分矩阵计算得到所述整合的用户-项目评分矩阵中各用户之间的相似度值;或,根据所述各子辅助领域的用户-项目评分矩阵计算得到所述各子辅助领域中各用户之间的相似度值;根据所述各子辅助领域与所述目标领域的相似性权重系数,以及所述各子辅助领域中各用户之间的相似度值,计算所述各子辅助领域之间用户的相似度值。4.根据权利要求3所述的方法,其特征在于,所述根据所述各子辅助领域与所述目标领域的相似性权重系数,以及所述各子辅助领域中各用户之间的相似度值,计算所述各子辅助领域之间用户的相似度值包括:按照如下方式计算所述各子辅助领域之间用户的相似度值:所述D表示所述多个子辅助领域的集合;所述wd表示子辅助领域d与所述目标领域的相似性权重系数;所述(si,j)d表示根据所述子辅助领域d的用户-项目评分矩阵计算得到的用户i和用户j的相似度值。5.根据权利要求1所述的方法,其特征在于,所述根据所述辅助领域中各用户之间的相似度值和所述目标领域的用户-项目评分矩阵计算所述辅助领域中各用户对所述目标领域中目标项目的预测评分包括:根据所述辅助领域中各用户之间的相似度值确定所述辅助领域中各用户的相似用户;根据所述辅助领域中各用户与对应的相似用户之间的相似度值,以及所述目标领域的用户-项目评分矩阵,计算所述辅助领域中各用户对所述目标领域中目标项目的预测评分。6.根据权利要求5所述的方法,其特征在于,所述根据所述辅助领域中各用户之间的相似度值确定所述辅助领域中各用户的相似用户包括:基于所述辅助领域中各用户之间的相似度值,确定得到与第一用户的相似度值大于第一预设值的用户集合,所述第一用户为所述辅助领域中的用户;按照相似度值从大到小的顺序从所述用户集合中确定预置数目个用户作为所述第一用户的相似用户。7.根据权利要求5所述的方法,其特征在于,所述根据所述辅助领域中各用户与对应的相似用户之间的相似度值,以及所述目标领域的用户-项目评分矩阵,计算所述辅助领域中各用户对所述目标领域中目标项目的预测评分包括:按照如下方式计算所述辅助领域中各用户对所述目标领域中目标项目的预测评分:所述Pi,b表示所述辅助领域中用户i对所述目标领域中目标项目b的预测评分;所述N表示所述辅助领域中与所述用户i相似且对所述目标领域的项目有评分的用户的用户集合;所述si,k表示所述辅助领域中用户i和用户k之间的相似度值,其中所述用户k包含于所述用户集合N中;所述rk,b表示所述用户k对所述目标领域中目标项目b的评分。8.根据权利要求1至7中任一项所述的方法,其特征在于,所述根据所述辅助领域中各用户之间的相似度值和所述目标领域的用户-项目评分矩阵计算所述辅助领域中各用户对所述目标领域中目标项目的预测评分之后,所述方法还包括:根据所述目标项目的预测评分,生成所述辅助领域中各用户的推荐项目,所述推荐项目包含于所述目标项目。9.根据权利要求8所述的方法,其特征在于,所述根据所述目标项目的预测评分,生成所述辅助领域中各用户的推荐项目包括:若第一用户对应的目标项目中存在预测评分大于第二预设值的项目时,则确定所述预测评分大于第二预设值的项目为所述第一用户的推荐项目,所述第一用户为所述辅助领域中的用户;或,按照预测评...

【专利技术属性】
技术研发人员:程萌熊安斌张锋
申请(专利权)人:华为软件技术有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1