【技术实现步骤摘要】
一种基于聚类的协同过滤推荐方法和装置
本专利技术涉及推荐算法
,特别是涉及一种基于聚类的协同过滤推荐方法和装置。
技术介绍
随着互联网技术的高速发展,互联网为用户提供了各种各样的海量信息,丰富和便利着人们的工作和生活。但同时,用户从海量信息中获取感兴趣的信息也成了件费时费力的事情。为此,产生了推荐算法,推荐算法不需要用户提供明确的需求,而是通过用户的历史行为来分析用户的兴趣和需求,以便为用户推荐能够满足兴趣和需求的物品。具体的,协同过滤推荐算法为应用较为广泛的推荐算法之一,协同过滤推荐算法的处理步骤如下:第一步,从预设的公开数据集中,获取用户和物品发生相互作用的历史记录。通常情况下,可以从专门研究推荐系统的网站上获取公开数据集。用户和物品发生相互作用的历史记录包括用户-物品评分矩阵、用户-物品消费矩阵等,其中,用户-物品评分矩阵包括多个物品,以及每个物品得到的来自用户的评分。需要说明的是,每个物品得到的评分可能来自不同的用户。下面将用户-物品评分矩阵简称为评分矩阵,并以评分矩阵为例进行说明。为了方便说明,将推荐物品的对象称为目标用户,将推荐给目标用户的物品称 ...
【技术保护点】
1.一种基于聚类的协同过滤推荐方法,其特征在于,包括:从预设的标签基因组信息矩阵中,获取第一物品的标签基因组向量,标签基因组向量用于描述第一物品的固有属性;使用预设的聚类算法,基于第一物品的标签基因组向量,将第一物品划分为预设第一数量的簇类;针对各目标物品:当该目标物品与第二物品属于同一簇类时,基于该目标物品的标签基因组向量与第二物品的标签基因组向量之间的预设类型的距离,计算该目标物品与第二物品的相关性系数,目标物品是指第一物品中,目标用户没有给出评分的物品,第二物品是指第一物品中,除所有目标物品以外的物品;当该目标物品与第二物品属于不同簇类时,基于该目标物品与第二物品的泊 ...
【技术特征摘要】
1.一种基于聚类的协同过滤推荐方法,其特征在于,包括:从预设的标签基因组信息矩阵中,获取第一物品的标签基因组向量,标签基因组向量用于描述第一物品的固有属性;使用预设的聚类算法,基于第一物品的标签基因组向量,将第一物品划分为预设第一数量的簇类;针对各目标物品:当该目标物品与第二物品属于同一簇类时,基于该目标物品的标签基因组向量与第二物品的标签基因组向量之间的预设类型的距离,计算该目标物品与第二物品的相关性系数,目标物品是指第一物品中,目标用户没有给出评分的物品,第二物品是指第一物品中,除所有目标物品以外的物品;当该目标物品与第二物品属于不同簇类时,基于该目标物品与第二物品的泊松相关系数,计算该目标物品与第二物品的相关性系数;将目标用户对第二物品的预设的评分,以及该目标物品与第二物品的相关性系数进行加权求和,得到目标用户对该目标物品的预测评分;将预测评分符合预设条件的目标物品,推荐给目标用户。2.根据权利要求1所述的方法,其特征在于,所述基于该目标物品与第二物品的泊松相关系数,计算该目标物品与第二物品的相关性系数的步骤,包括:计算该目标物品与第二物品的泊松相关系数;基于该目标物品与第二物品的共同用户的数量,以及计算出的泊松关系数,生成该目标物品与第二物品的缩放泊松相关系数,并将该目标物品与第二物品的缩放泊松相关系数作为该目标物品与第二物品的相关性系数。3.根据权利要求2所述的方法,其特征在于,所述基于该目标物品与第二物品的共同用户的数量,以及泊松关系数,生成该目标物品与第二物品的缩放泊松相关系数的步骤,包括:根据如下公式,基于该目标物品与第二物品的共同用户的数量,以及计算出的泊松关系数,生成该目标物品与第二物品的缩放泊松相关系数;在公式中,该目标物品为物品i;第二物品为物品j;sij为物品i与物品j的缩放泊松相关系数;ρij为物品i与物品j的泊松相关系数;nij为物品i与物品j的共同用户的数量;λ1为共同用户数量的参数。4.根据权利要求3所述的方法,其特征在于,所述预设类型的距离包括欧氏距离;所述将预设的目标用户对第二物品的评分,以及该目标物品与第二物品的相关性系数进行加权求和,得到目标用户对该目标物品的预测评分的步骤,包括:根据如下公式,将预设的目标用户对第二物品的评分,以及该目标物品与第二物品的相关性系数进行加权求和,得到目标用户对该目标物品的预测评分;在公式中,该目标物品为物品i;第二物品为物品j;目标用户为用户u;为用户u对物品i的预测评分;ruj为用户u对物品j的预测评分;sij为物品i与物品j的缩放泊松相关系数;ρij为物品i与物品j的泊松相关系数;εij为物品i的标签基因组向量与物品j的标签基因组向量的欧式距离值;κu为用户u对除物品i以外,给出评分的物品的集合;pij为调节系数;为将第一物品划分为k个簇类的情况下,与物品i属于同一簇类的物品的集合。5.根据权利要求4所述的方法,其特征在于,所述将预设的目标用户对第二物品的评分,以及该目标物品与第二物品的相关性系数进行加权求和,得到目标用户对该目标物品的预测评分的步骤,包括:将预设的目标用户对第二物品的评分,以及该目标物品与第二物品的相关性系数进行加权求和;使用个性化参数、用户偏向调整参数及物品偏向调整参数,在加权求和的结果的基础上进行调整,得到目标用户对该目标物品的预测评分。6.根据权利要求5所述的方法,其特征在于,所述将预设的目标用户对第二物品的评分,以及该目标物品与第二物品的相关性系数进行加权求和;使用个性化参数、用户偏向调整参数及物品偏向调整参数,在加权求和的结果的基础上进行调整,得到目标用户对该目标物品的预测评分的步骤,包括:使用如下公式,将预设的目标用户对第二物品的评分,以及该目标物品与第二物品的相关性系数进行加权求和;使用个性化参数、用户偏向调整参数及物品偏向调整参数,在加权求和的结果的基础上进行调整,得到目标用户对该目标物品的预测评分;在公式中,该目标物品为物品i;第二物品为物品j;目标用户为用户u;μ为预设的评分矩阵中的评分均值;bu为针对用户u的用户偏向调整参数;bi为针对物品i的物品偏向调整参数;αu为针对用户u的个性化参数;为用户u对物品i的预测评分;ruj为用户u对物品j的预测评分;sij为物品i与物品j的缩放泊...
【专利技术属性】
技术研发人员:高志鹏,李博,杨杨,王颖,谭清,王茜,肖楷乐,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。