The invention discloses a method comprising the steps of recommendation algorithm, multi label and sorting based on: 1) the label data formed by the combination of a multi label information; 2) computation of multidimensional tag similarity using multidimensional label information into the user collaborative filtering and forecasting score, to recommend the candidate set 1; 3) using multi label information as the implicit feedback information into the matrix decomposition and the prediction score, get the recommended candidate set 2, and combined with the recommended candidate set 1 final candidates set; 4) will eventually get the recommended candidate set is input to the logistic regression classification sorting model, according to the Top N output score ranking recommendation list. The combination of label information into multidimensional tags into collaborative filtering recommendation candidate set, then Top N recommended list by logistic regression and sorting, effectively alleviate the problem of the cold start recommendation system, sparsity and scalability problems, improve the recommendation effect.
【技术实现步骤摘要】
一种基于多维标签与分类排序的推荐算法
本专利技术涉及数据挖掘的推荐系统
,尤其是指一种基于多维标签与分类排序的推荐算法。
技术介绍
协同过滤的推荐算法是目前使用最广泛且发展成熟的个性化推荐算法。基于近邻协同过滤是利用相似近邻进行推荐,冷启动和稀疏性问题可能导致计算得到的用户相似度不准确,进而影响协同过滤的推荐性能。对基于用户的协同过滤来说,核心是计算用户相似度,计算两个用户之间相似度需要这两个用户评价过相同的项目,然而在推荐系统中对于大量的物品,用户操作过的物品只占很小一部分,也就是推荐系统存在稀疏性。本来两个相似的用户,可能因为他们评价的项目较少而导致了他们之间没有共同评价过的项目,稀疏性会导致这两个相似的用户在相似度计算的时候相似度为0,引起比较大的误差。Top-N推荐更加符合推荐系统的本质,不少研究将Top-N推荐问题看作是排序问题,使用排序学习解决。常见的方法有基于点的排序,基于对的排序,基于列表的排序。但是不是所有的排序学习算法都适合用于协同过滤。基于对的排序学习将排序问题转化为多个二分类问题,对任意两个文档进行比较,时间复杂度较高。基于对的排序学 ...
【技术保护点】
一种基于多维标签与分类排序的推荐算法,其特征在于,包括以下步骤:1)对标签数据进行组合构成多维标签信息;2)利用多维标签信息计算多维标签相似度,融入用户协同过滤中并预测评分,得到推荐候选集1;3)利用多维标签信息作为隐式反馈信息输入到矩阵分解中并预测评分,得到推荐候选集2,并结合推荐候选集1得到最终推荐候选集;4)将得到的最终推荐候选集输入到逻辑回归分类模型中分类排序,根据输出分值排序得到Top‑N推荐列表。
【技术特征摘要】
1.一种基于多维标签与分类排序的推荐算法,其特征在于,包括以下步骤:1)对标签数据进行组合构成多维标签信息;2)利用多维标签信息计算多维标签相似度,融入用户协同过滤中并预测评分,得到推荐候选集1;3)利用多维标签信息作为隐式反馈信息输入到矩阵分解中并预测评分,得到推荐候选集2,并结合推荐候选集1得到最终推荐候选集;4)将得到的最终推荐候选集输入到逻辑回归分类模型中分类排序,根据输出分值排序得到Top-N推荐列表。2.根据权利要求1所述的一种基于多维标签与分类排序的推荐算法,其特征在于:在步骤1)中,所述多维标签信息是指通过用户标签和物品标签组合,并根据不同物品标签之间的联系进行组合,包含以下步骤:1.1)一个用户标签对应多个取值,将用户标签离散化,设用户标签集合为M={m1,m2,m3...mz},z为用户标签的取值个数;1.2)假设物品标签集合N1={t1,t2,...,tn},n为物品标签的个数,利用符号﹒表示将不同标签组合到一块,则二阶标签集合表示为N2={t1·t2,t1·t3...tn-1·tn};1.3)将用户标签M,物品标签N1,物品标签组合N2整合一起组成多维标签集合,为M∪N1∪N2。3.根据权利要求1所述的一种基于多维标签与分类排序的推荐算法,其特征在于:在步骤2)中,利用多维标签计算用户相似度,包括以下步骤:2.1)定义用户集合{u1,u2,u3…uN},多维标签集合为{t1,t2,t3…tK},其中N为用户数量,K为多维标签集合中标签数量,用户uj对物品的操作得到用户uj对标签tk的操作次数为njk,得到用户uj的多维标签操作向量Ij=(nj1,nj2,nj3…njK),其中j=1,2,3,…,N,则得到用户-多维标签操作矩阵IN×K为:2.2)利用余弦相似度计算用户u,v的多维标签向量Iu,Iv的相似度,计算公式为:2.3)使用线性加权的方法在用户协同过滤中综合考虑多维标签信息的相似度,使用参数λ控制多维标签相似度在协同过滤相似度中的权重,用户相似度组成如下面式子所示;sim(u,v)=(1-λ)sim1(u,v)+λsim2(u,v)式中,sim1(u,v)为原始的相似度,sim2(u,v)为多维标签相似度;2.4)最后根据以下式子计算用户u对物品i的评分得出多个高评分的推荐物品集合;式中,为活跃用户u的评分均值,为近邻用户v的评分均值,N(u)为用户u的近邻集合,sim(u,v)为用户u与他的近邻用户v的相似度;在步骤3)中,将用户-多维标签操作矩阵IN×K转化为二元反馈矩阵,输入矩阵分解中,包括以下步骤:3.1)将多维标签信息转化为二元反馈信息,将用户-多维标签矩阵IN×K通过下面式子转化为二元的用户-多维标签反馈矩阵;
【专利技术属性】
技术研发人员:董敏,刘皓熙,毕盛,汤雪,裴茂锋,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。