一种标签推荐方法及系统技术方案

技术编号:16546959 阅读:38 留言:0更新日期:2017-11-11 11:45
本发明专利技术公开一种标签推荐方法及系统。该方法包括:获取所有用户对所有项目标注的标签总集合;利用Apriori算法寻找系统标签总集合中的最大频繁项集;将系统最大频繁项集设定为新的标识;将系统第一标签集合中最大频繁项集替换为系统新的标识,形成第二标签集合;将用户、项目、第二标签集合相互对应,生成用户‑项目‑标签的三维张量数据,并将三者的关联权重设为1;利用HOSVD算法对系统三维张量数据进行分解,得到每个用户对每个项目标注的标签的权重值;向第一用户推荐权重值高的标签,供该用户对项目标注标签使用,该用户为第一次对该项目标注标签的用户。采用本发明专利技术的方法或系统,可以使标签分类更加细致,使推荐系统准确性获得提高,命中率逐渐增大。

A tag recommendation method and system

The invention discloses a tag recommendation method and system. The method comprises: acquiring all users on all projects total label set; using Apriori algorithm of maximal frequent itemsets in the collection system for total label system; maximum frequent itemsets set for the new logo will be the first label collection system; maximum frequent itemsets to replace the new system identification, the formation of second tags set; user, project, second sets of tags corresponding to each other, the three-dimensional tensor data generating user project label, and the association of three weights are set to 1; to decompose the system of 3D tensor data using the HOSVD algorithm, the weight per user annotation for each item tag to the first user recommended weight value; the high value of the label for the user to use the user labeling project, for the first time on the labeling of users. By adopting the method or system of the invention, the label classification can be made more detailed, and the accuracy of the recommendation system is improved, and the hit rate is gradually increased.

【技术实现步骤摘要】
一种标签推荐方法及系统
本专利技术涉及个性化推荐领域,特别是涉及一种标签推荐方法及系统。
技术介绍
现如今,Web技术的发展突飞猛进,用户可以在多种多样的网络平台上对一个项目标注多个不同的标签,尤其是在各个平台的推荐系统应用方面,系统通过标签来探索每个用户的喜好特征,当用户对未标注过标签的项目标注标签时,可以更有效地向用户推荐合适的标签供用户标注,帮助用户快速找到自己满意的标签。项目是指用户标注标签的对象,例如电影、视频、文章等。以往的推荐算法大多针对的是基于二元关系的用户-项目的评分矩阵数据进行研究,随着标签数据的加入,由用户、项目和标签组成的三元关系数据处理成为了近年来推荐算法研究的重点。由于推荐系统中用户、项目和标签数量的与日俱增,三者组成的权值数据规模呈指数速度增长,数据稀疏性逐渐变大,由此用于处理该数据的推荐算法的推荐准确性降低,成为推荐技术需解决的最主要的问题。
技术实现思路
本专利技术的目的是提供一种标签推荐方法及系统,以解决现有技术中推荐算法推荐准确性低的问题。为实现上述目的,本专利技术提供了如下方案:一种标签推荐方法,所述方法包括:依次获取所有用户对所有项目标注的标签总本文档来自技高网...
一种标签推荐方法及系统

【技术保护点】
一种标签推荐方法,其特征在于,所述方法包括:依次获取所有用户对所有项目标注的标签总集合,所述标签总集合包括所有的第一标签集合,所述第一标签集合为一个用户对一个项目标注的标签的集合,所述第一标签集合包括M个标签,M为大于0的整数;利用Apriori算法寻找所述标签总集合中的最大频繁项集;将所述最大频繁项集设定为新的标识;将所述第一标签集合中所述最大频繁项集替换为所述新的标识,形成第二标签集合;将用户、项目、第二标签集合相互对应,生成用户‑项目‑标签的三维张量数据,并将三者的关联权重设为1;利用HOSVD算法对所述三维张量数据进行分解,得到每个用户对每个项目标注的标签的权重值;根据所述标签权重值,...

【技术特征摘要】
1.一种标签推荐方法,其特征在于,所述方法包括:依次获取所有用户对所有项目标注的标签总集合,所述标签总集合包括所有的第一标签集合,所述第一标签集合为一个用户对一个项目标注的标签的集合,所述第一标签集合包括M个标签,M为大于0的整数;利用Apriori算法寻找所述标签总集合中的最大频繁项集;将所述最大频繁项集设定为新的标识;将所述第一标签集合中所述最大频繁项集替换为所述新的标识,形成第二标签集合;将用户、项目、第二标签集合相互对应,生成用户-项目-标签的三维张量数据,并将三者的关联权重设为1;利用HOSVD算法对所述三维张量数据进行分解,得到每个用户对每个项目标注的标签的权重值;根据所述标签权重值,向第一用户推荐标签,供所述第一用户对第一项目标注标签使用,所述第一用户为第一次对所述第一项目标注标签的用户,所述第一项目为所有项目中的任意一个项目。2.根据权利要求1所述的方法,其特征在于,所述利用Apriori算法寻找所述标签总集合中的最大频繁项集之前,还包括:将标签数据转换成适用于Apriori算法计算的格式。3.根据权利要求1所述的方法,其特征在于,所述利用Apriori算法寻找所述标签总集合中的最大频繁项集,具体包括:设定最小支持度,所述最小支持度为标签出现的频率的设定阈值;将所有第一标签集合中出现频率大于所述最小支持度的标签生成频繁一项集,所述频繁一项集中每个元素为一个标签;将两个不同的频繁一项集合并为一个二项集,遍历所有的频繁一项集,生成所有的二项集,所述二项集中包括两个标签,将所有二项集中两个标签同时出现的频率大于所述最小支持度的二项集生成频繁二项集;所述频繁二项集中每个元素为二项集中的两个标签;将频繁k项集中的任意两个元素连接,形成k+1项集,所述频繁k项集中每个元素包括k个不同的标签,所述k+1项集中包括k+1个不同的标签;遍历所述频繁k项集中的所有元素,生成所有的k+1项集;其中k为大于1的整数;判断是否所有的k+1项集中的k+1个标签同时出现的频率均小于所述最小支持度,得到第一判断结果;当所述第一判断结果表示所有的k+1项集中的k+1个标签同时出现的频率均小于所述最小支持度时,确定所述频繁k项集为最大频繁项集;当所述第一判断结果表示所有的k+1项集出现的频率不全小于所述最小支持度时,将所有k+1项集中的k+1个标签同时出现频率大于所述最小支持度的k+1项集生成频繁k+1项集,所述频繁k+1项集中每个元素包括k+1项集中的k+1个不同的标签。4.根据权利要求1所述的方法,其特征在于,所述利用HOSVD算法对所述三维张量数据进行分解,具体包括:将所述三维张量数据利用公式沿着三个模方向进行分解,其中所述三维张量表示为A1为所述三维张量A的1-模的矩阵展开形式;A2为所述三维张量A的2-模的矩阵展开形式;A3为所述三维张量A的3-模的矩阵展开形式;利用奇异值分解算法对所述A1、A2、A3进行分解,得到其中U(1)表示矩阵A1的左奇异特征矩阵,V1T表示矩阵A1的右奇异特征矩阵的转置矩阵,S1表示由矩阵A1奇异值组成的对角矩阵;U(2)表示矩阵A2的左奇异特征矩阵,V2T表示矩阵A2的右奇异特征矩阵的转置矩阵,S2表示由矩阵A2奇异值组成的对角矩阵;U(3)表示矩阵A3的左奇异特征矩阵,V3T表示矩阵A3的右奇异特征矩阵的转置矩阵,S3表示由矩阵A3奇异值组成的对角矩阵;利用所述奇异值分解算法对所述左奇异特征矩阵U(1)、U(2)、U(3)降维,对应得到其中的维度为c1;的维度为c2;的维度为c3;利用公式得到近似核心张量利用HOSVD算法得到三维张量A降维后的近似张量根据所述近似张量得到每个用户对每个项目标注的标签权重值。5.根据权利要求1所述的方法,其特征在于,所述根据所述标签权重值,向第一用户推荐标签,具体包括:根据所述标签权重值,利用Top-N算法得到高于其他权重值的N个权重值;将所述N个权重值对应的标签推荐给所述第一用户。6.一种标签推荐系统,其特征在于,所述系统包括:标签总集合获取模块,用于依次获取所有用户对所有项目标注的标签总集合,所述标签总集合包括所有的第一标签集合,所述第一标签集合为一个用户对一个项目标注的标签集合,所...

【专利技术属性】
技术研发人员:李凤莲张雪英李彦民焦江丽田玉楚王燕黄丽霞
申请(专利权)人:太原理工大学
类型:发明
国别省市:山西,14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1