【技术实现步骤摘要】
一种基于组合算法的个性化图书推荐方法
本专利技术涉及适用于针对用户喜好进行图书推荐的计算机信息领域,尤其涉及一种基于组合算法的个性化图书推荐方法。
技术介绍
现有技术中向用户推荐电子图书的方法有多种,第一种方法是基于用户以往的阅读历史数据,推断用户的阅读偏好,再根据推断出的阅读偏好向用户推荐对应的电子图书。但在该种方法中,对于用户阅读偏好的推断存在一定不足,主要是:由于阅读平台所提供的图书的类别分布不均,且原创类图书较多,通常主要集中在言情、穿越等类别;同时由于手机阅读用户的主要用户群是学生、外来务工人员和都市白领,而这一大部分用户访问图书通常集中在言情穿越等热门分类上,造成系统在对用户偏好进行判定时大部分用户的偏好被判定为热门分类。上述这种情况对于图书推荐造成很多障碍,例如根据系统判断,许多高端商务人士可能被判定为言情或穿越类的阅读偏好,对其进行相应的图书推荐容易引起反感和用户体验下降。第二种方法:由于仅根据历史数据推断用户的偏好会造成上述问题,因此,现有技术中出现了基于用户身份类型来推断用户的阅读偏好,进而进行相应的图书推荐的方法。但该方法存在如下不足:现有系 ...
【技术保护点】
一种基于组合算法的个性化图书推荐方法,其特征在于,包括如下步骤:S1:对图书的内容信息进行关键词提取,求得图书的特征向量;S2:根据用户浏览或下载到的图书的特征向量求得用户的特征向量,再求得用户对某个新书的评分值;S3:通过用户‑图书实际行为数据对来统计每个用户的行为图书和每个图书的行为用户,生成“用户行为倒排表和查询索引”和“图书行为倒排表和查询索引”;S4:根据用户对某个新书的评分值来计算两个用户之间的相似度,以及两本图书之间的相似度,生成相似度文件和查询索引:相似用户索引和查询索引、相似图书索引和查询索引;S5:根据S3中生产的“用户行为倒排表和查询索引”和“图书行为 ...
【技术特征摘要】
1.一种基于组合算法的个性化图书推荐方法,其特征在于,包括如下步骤:S1:对图书的内容信息进行关键词提取,求得图书的特征向量;S2:根据用户浏览或下载到的图书的特征向量求得用户的特征向量,再求得用户对某个新书的评分值;S3:通过用户-图书实际行为数据对来统计每个用户的行为图书和每个图书的行为用户,生成“用户行为倒排表和查询索引”和“图书行为倒排表和查询索引”;S4:根据用户对某个新书的评分值来计算两个用户之间的相似度,以及两本图书之间的相似度,生成相似度文件和查询索引:相似用户索引和查询索引、相似图书索引和查询索引;S5:根据S3中生产的“用户行为倒排表和查询索引”和“图书行为倒排表和查询索引”,以及S4中生成的相似用户索引和查询索引、相似图书索引和查询索引计算给用户的图书推荐指数。2.根据权利要求1所述的一种基于组合算法的个性化图书推荐方法,其特征在于,所述S1的具体步骤包括:S11:抽取图书中的关键词,生成图书-关键词和关键词-图书两个倒排表;S12:根据S11中图书-关键词和关键词-图书倒排表,使用TF-IDF的方法,计算关键词ki的词频TFij、以及倒排频率IDFi:其中,fij为关键词ki在一本图书Bj中出现的次数,Max(fj)表示所有的图书Bj中关键词出现的最大次数,ni表示关键词ki出现过的图书的数量,N为新书的数目;S13:关键词ki在图书Bj中TF-IDF权重Wij为TFij×IDFi;S14:每本图书Bj的特征向量可以表示为:3.根据权利要求1所述的一种基于组合算法的个性化图书推荐方法,其特征在于,S2中,用户的特征向量通过浏览或下载的图书的特征向量的平均值来表示为则用户与对某个新书的评分值可以用余弦公式计算得到:其中,Ci表示用户,该值大于0小于1,0表示没有浏览或下载,1表示浏览或下载。4.根据权利要求1所述的一种基于组合算法的个性化图书推荐方法,其特征在于,所述S3中,生成用户行为倒排表和查询索引的具体步骤包括:S31:按UserID排序用户-行为图书查询索引;S32:统计相同UserID发生行为对象的BookID,将每组UserID行为对象的BookID放入到排表文件中,一组接着一组顺序写入;S33:将每个UserID行为对象的BookID、数量、在倒排文件中的起始地址写入索引文件;生成图书行为倒排文件和查询索引的具体步骤包括:S34:按Book.ID排序行为图书-用户查询索引;S35:统计相同BookID发生行为对象的UserID,将每组BookID行为对象的UserID放入到排表文件中,一组接着一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。