一种图书推荐方法技术

技术编号:8271469 阅读:225 留言:0更新日期:2013-01-31 03:42
一种图书推荐方法,包括有:步骤A、根据图书的作者、三级分类、四级分类和通用标签,构建图书库中每本图书的图书标签向量;步骤B、根据用户的图书阅读记录中所有已深度阅读图书的作者、三级分类、四级分类、通用标签及其分别对应的权重值,建立每个用户的文本标签向量;步骤C、根据图书的图书标签向量中作者、三级分类、四级分类、通用标签分别在用户的文本标签向量中对应的权重值,计算图书库中所有图书对应于每位用户的标签得分。本发明专利技术属于网络应用技术领域,能根据图书的内容以及用户的阅读喜好,向用户进行图书的个性化推荐,为用户推荐出更符合用户喜好的图书,提高用户的满意度,改善用户体验。

【技术实现步骤摘要】
本专利技术涉及一种图书推荐方法,属于网络应用

技术介绍
随着移动 、互联网技术的飞速发展,图书的数字化成为一个必然趋势。越来越多的图书阅读平台受到了用户的高度关注,并取得了迅猛发展,已经成为人们获取信息和知识的重要途径。图书阅读平台上通常拥有海量的数字图书资源,如何有效地利用这些丰富而宝贵的资源,让用户能够更快捷地找到并充分地利用它们就显得非常重要,因此图书的个性化智能推荐是图书阅读平台的一个很重要的功能。目前图书阅读平台在图书推荐中所广泛采用的方式包括有 1、基于图书分类或类型的推荐方法,通过图书分类,将与用户已读图书同分类或者同类型的图书向用户推荐,这种方法没有考虑到图书的内容主题和关键词; 2、基于图书内容的推荐方法,采用TF-IDF(词频-反文档频率,即term frequency -inverse document frequency)公式等进行基于图书文本内容的推荐,由于图书阅读平台中许多图书是虚构或者原创类图书,其中涉及到的主人公和事件等都是虚构的,因而基于文本内容的推荐方法的适用性不好,不能为用户推荐出更符合用户喜好的图书以提高用户的满意度,其性能和用户体验不佳。因此,如何根据图书的内容以及用户的阅读喜好,向用户进行图书的个性化推荐,仍是一个急需要解决的技术难题。
技术实现思路
有鉴于此,本专利技术的目的是提供一种图书推荐方法,能根据图书的内容以及用户的阅读喜好,向用户进行图书的个性化推荐。为了达到上述目的,本专利技术提供了一种图书推荐方法,所述方法包括有 步骤A、根据图书的作者、三级分类、四级分类和通用标签,构建图书库中每本图书的图书标签向量; 步骤B、根据用户的图书阅读记录中所有已深度阅读图书的作者、三级分类、四级分类、通用标签及其分别对应的权重值,建立每个用户的文本标签向量; 步骤C、根据图书的图书标签向量中作者、三级分类、四级分类、通用标签分别在用户的文本标签向量中对应的权重值,计算图书库中所有图书对应于每位用户的标签得分。与现有技术相比,本专利技术的有益效果是本专利技术根据图书阅读平台的特点,利用用户的图书深度阅读记录为基础来评价其对图书作者、三级分类、四级分类及通用标签的喜好程度,并据此形成相应的作者、三级分类、四级分类及通用标签权重向量,从而建立所有用户的文本标签向量;为了在图书和用户之间建立相应的联系,根据图书的作者、三级分类、四级分类、通用标签这些基本信息,建立图书库中所有图书的图书标签向量;通过图书的图书标签向量和用户的文本标签向量的匹配度计算,以及权重设置,最后获得所有图书相对于用户喜好的标签得分,即推荐图书的优先级,将标签得分最高的图书向用户推荐,从而为用户推荐出更符合用户喜好的图书,提高用户的满意度,改善用户体验。附图说明图I是本专利技术一种图书推荐方法流程图。图2是图I步骤C中,计算第i本图书对应于第j位用户的标签得分的具体操作流程图。具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和实施例对本专利技术作进一步的详细描述。·如图I所示,本专利技术一种图书推荐方法,包含有 步骤A、根据图书的作者、三级分类、四级分类和通用标签,构建图书库中每本图书的图书标签向量; 步骤B、根据用户的图书阅读记录中所有已深度阅读图书的作者、三级分类、四级分类、通用标签及其分别对应的权重值,建立每个用户的文本标签向量; 步骤C、根据图书的图书标签向量中作者、三级分类、四级分类、通用标签分别在用户的文本标签向量中对应的权重值,计算图书库中所有图书对应于每位用户的标签得分; 步骤D、比较图书库中所有图书对应于每位用户的标签得分,并根据用户的图书阅读记录过滤用户已阅读图书,最后将标签得分最高的若干本图书向所述用户推荐。图I步骤A中,每本图书的图书标签向量book. tM i=< antiior ., das^ i, dLass4 i, mmmm i>。其--------- H·····—----------mmm_111,I旬I〗叩中第i本图书的图书标签向量,獲illiorj圮笫 本图书的作者,dasslj是第i本图书的三级分类,chss4J是第i本图书的四级分类,由于每本图书可能存在多个通用标签,将所述多个通用标签构成通用标签向量表示,■ 是第i本图书的通用标签向量。图书具有作者、三级分类、四级分类、通用标签等基本信息。其中,三级分类和四级分类是由编辑根据图书平台的分类规则和图书内容进行指定,通用标签是由编辑根据每本图书内容所选择的部分能代表图书内容特征的关键词。以图书“锦衣杀明”为例,其作者是“拉丁海十三郎”,三级分类是“历史”,四级分类为空,通用标签是“扮猪吃老虎”、“变革”、“复仇”、“爽文”、“铁血”、“小白文”、“阴谋”、“元明”。图I步骤B中,每个用户的文本标签向量丽 J 碣」= a>,其中,BSfif 一tag—j是第j位用户的文本标签向量,通―j是第j位用户所有已深度阅读图书的作者所构成的作者向量(例如_ i=〈宅猪,林海听涛,庚新,拉丁海十一郎>),__〗是对应于通—j中每个作者的权重值所构成的作者权重向量;d」是第j位用户所有已深度阅读图书的三级分类所构成的三级分类向量(例如=<历史,仙侠,玄幻,官场,军事,竞技>),是对应于 d_j中每个三级分类的权重值所构成的三级分类权重向量;c+j是第j位用户所有已深度阅读图书的四级分类所构成的四级分类向量(例如c4J=〈古典仙侠,三国演义,仙路幻想>),c4w i是对应于 c4 i中每个四级分类的权重值所构成的四级分类权重向 JBBBBK JJ量;l_j是第j位用户所有已深度阅读图书的通用标签所构成的通用标签向量(例如€」=〈老白文 ,升级流,扮猪吃老虎,非人类,搞笑,胖子,重生流>), 0 _』是对应于*Li中每个通用标签的权重值所构成的通用标签权重向量。所述步骤B中,每个用户的文本标签向量中的参数可以基于用户在最近一段时间(如6个月)内的图书深度阅读记录来进行分析计算,即首先挑选出用户最近一段时间内的图书阅读记录,并依据图书深度阅读的判定标准,从所挑选出的图书阅读记录中进一步筛选出用户的图书深度阅读记录。根据图书的不同类型,可以采用不同的图书深度阅读的判定标准。例如,满足以下条件之一即为用户的深度阅读图书(其中,阅读深度=阅读章节数/总章节数) a.图书总章节数〈=10、(阅读章节数一免费章节数)>0、近6个月累计阅读深度>=70% ;b.图书总章节数>10、(阅读章节数一免费章节数)>0、近6个月累计阅读深度>=40%; c.连载图书总章节数>184、(阅读章节数一免费章节数)>0、近6个月累计阅读章节数 >=74。值得一提的是, 通|| _j中的权重值与中的作者是--对应的,例如 通 i=〈宅猪,林海听涛,庚新,拉丁海i^一郎,…〉, m i=<0. 11,0.21,O.29,O. 18,…〉,则表示作者“宅猪”对应的权重值为O. 11,作者“林海听涛”对应的权重值为O. 21,作者“庚新”对应的权重值为O. 29,作者“拉丁海i^一郎”对应的权重值为ο. is。同样,_ i中的权重值与 本文档来自技高网...

【技术保护点】
一种图书推荐方法,其特征在于,所述方法包括有:步骤A、根据图书的作者、三级分类、四级分类和通用标签,构建图书库中每本图书的图书标签向量;步骤B、根据用户的图书阅读记录中所有已深度阅读图书的作者、三级分类、四级分类、通用标签及其分别对应的权重值,建立每个用户的文本标签向量;步骤C、根据图书的图书标签向量中作者、三级分类、四级分类、通用标签分别在用户的文本标签向量中对应的权重值,计算图书库中所有图书对应于每位用户的标签得分。

【技术特征摘要】
1.一种图书推荐方法,其特征在于,所述方法包括有 步骤A、根据图书的作者、三级分类、四级分类和通用标签,构建图书库中每本图书的图书标签向量; 步骤B、根据用户的图书阅读记录中所有已深度阅读图书的作者、三级分类、四级分类、通用标签及其分别对应的权重值,建立每个用户的文本标签向量; 步骤C、根据图书的图书标签向量中作者、三级分类、四级分类、通用标签分别在用户的文本标签向量中对应的权重值,计算图书库中所有图书对应于每位用户的标签得分。2.根据权利要求I所述的方法,其特征在于,还包括有 步骤D、比较图书库中所有图书对应于每位用户的标签得分,并根据用户的图书阅读记录过滤用户已阅读图书,最后将标签得分最高的若干本图书向所述用户推荐。3.根据权利要求I所述的方法,其特征在于,所述步骤A中,每本图书的图书标签向量4.根据权利要求I所述的方法,其特征在于,所述步骤B中,每个用户的文本标签向量5.根据权利要求4所述的方法,其特征在于,所述步骤B中,6.根据权利要求4所述的方法,其特征在于,所述步骤B中,7.根据权利要求I所述的方法,其特征在于,所述步骤C中,图书库中所有图书对应于每位用户的标签得分8.根据权利要求7所述的方法,其特征在于,所述步骤C中,计算第i本图书对应于第j位用户的标签得分...

【专利技术属性】
技术研发人员:廖建新李萍周立娟崔晓茹赵贝尔张雷
申请(专利权)人:杭州东信北邮信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1