基于数据分析的版式轻阅读推荐方法及系统技术方案

技术编号:38598413 阅读:15 留言:0更新日期:2023-08-26 23:33
本发明专利技术涉及数据处理技术领域,具体涉及基于数据分析的版式轻阅读推荐方法及系统,包括:获取阅读数据的标签集合,记为用户标签集合,根据用户的阅读数量、阅读时长、阅读进度得到三个相似度影响因子;根据预选书籍的标签集合和相似度影响因子计算改进Jaccard相似度;将改进Jaccard相似度最大预设数量的预选书籍推荐给用户。本发明专利技术根据相似度影响因子得到改进Jaccard相似度,使用Jaccard相似度提升版式轻阅读推荐方法及系统的准确度。轻阅读推荐方法及系统的准确度。轻阅读推荐方法及系统的准确度。

【技术实现步骤摘要】
基于数据分析的版式轻阅读推荐方法及系统


[0001]本专利技术涉及数据处理
,具体涉及基于数据分析的版式轻阅读推荐方法及系统。

技术介绍

[0002]轻阅读智能推荐是一种基于数据分析技术的阅读推荐系统。它可以根据用户的兴趣、阅读历史和行为等信息,为用户推荐相关的文章、图书、新闻等内容,帮助用户更快、更准确地找到自己感兴趣的信息。轻阅读智能推荐的优点在于,它可以帮助用户节省时间和精力,避免在大量信息中寻找自己需要的内容。同时,它也可以帮助用户发现新的、有趣的内容,拓展自己的知识和视野。
[0003]现有的轻阅读推荐系统是利用Jaccard相似度算法根据预推荐书籍标签与用户注册账户时选择的兴趣标签以及已阅读书籍所含标签的交集占比大小来推荐书籍的,但是标签推荐系统只能基于已有的标签进行推荐,而无法考虑其他因素,如用户的历史行为、个人喜好等,且标签具有偏差性,每阅读完一本新的书籍就有可能出现新用户不感兴趣的标签,使阅读推荐书籍标签不具有代表性。

技术实现思路

[0004]本专利技术提供基于数据分析的版式轻阅读推荐方法及系统,以解决现有的问题。
[0005]本专利技术的基于数据分析的版式轻阅读推荐方法及系统采用如下技术方案:一方面,本专利技术一个实施例提供了基于数据分析的版式轻阅读推荐方法,该方法包括以下步骤:采集用户的所有已阅读书籍的标签和用户阅读数据;获取已阅读书籍的标签集合,记为用户标签集合,根据阅读数据获得用户标签集合中每个标签的数量相似度影响因子、时间相似度影响因子、进度相似度影响因子;根据数量相似度影响因子、时间相似度影响因子以及进度相似度影响因子获得每个标签的标签权重;获取预选书籍,将预选书籍的标签和用户标签集合的交集记为交集A,将预选书籍的标签和用户标签集合的差集记为差集B,根据交集A中每个标签的标签权重、差集B中的集合元素数量以及用户标签集合中标签权重均值得到预选书籍的相似度,将相似度最大预设数量的预选书籍推荐给用户。
[0006]优选的,所述获取已阅读书籍的标签集合,记为用户标签集合,包括的具体步骤如下:用户已阅书籍数量记为n,于是得到n个标签集合,则用户标签集合为:
E表示用户标签集合,表示第i本的已阅读书籍标签集合,表示用户预设的感兴趣的书籍标签集合,表示计算集合元素数量的函数,表示求并集。
[0007]优选的,所述根据阅读数据获得用户标签集合中每个标签的数量相似度影响因子、时间相似度影响因子、进度相似度影响因子,包括的具体步骤如下:用户标签集合中的元素是指书籍标签,表示为,表示第j个书籍标签,集合中书籍标签的数量,用户标签集合下书籍数量的集合表示为,根据用户标签集合下阅读数量计算数量相似度影响因子:根据用户标签集合下阅读数量计算数量相似度影响因子:表示第个标签下的已阅读书籍数量,表示第个标签的数量相似度影响因子;每个用户标签下阅读时长的集合表示为,根据用户标签集合下阅读时长计算时间相似度影响因子:签集合下阅读时长计算时间相似度影响因子:表示第j个标签下的已阅读书籍的阅读时长,表示第j个标签的时间相似度影响因子;每个用户标签集合下阅读进度的集合表示为M,根据用户标签集合下阅读时长计算进度相似度影响因子:用户标签集合下阅读时长计算进度相似度影响因子:表示第j个标签下的已阅读书籍平均进度,表示第j个标签的进度相似度影响因子。
[0008]优选的,所述根据数量相似度影响因子、时间相似度影响因子以及进度相似度影响因子获得每个标签的标签权重,包括的具体步骤如下:包括的具体步骤如下:表示第j个标签的数量相似度影响因子,表示第j个标签的时间相似度影响因子,表示第j个标签的进度相似度影响因子,表示第j个标签的标签权重。
[0009]优选的,所述预选书籍是指用户未读读书籍。
[0010]优选的,所述将预选书籍的标签和用户标签集合的交集记为交集A,将预选书籍的标签和用户标签集合的差集记为差集B,根据交集A中每个标签的标签权重、差集B中的集合元素数量以及用户标签集合中标签权重均值得到预选书籍的相似度,包括的具体步骤如下:下:表示预选书籍中的任意一本书籍的相似度,A表示任意一本书籍自带标签和用
户标签集合的交集,表示交集A中第k个标签的标签权重,B表示自带标签与用户标签集合的差集,H表示用户标签集合中所有标签权重之和,Q表示用户标签集合中所有标签权重的平均值,表示集合中书籍标签的数量。
[0011]优选的,所述将相似度最大预设数量的预选书籍推荐给用户,包括的具体步骤如下:获得预选书籍中的任意一本书籍的相似度,将所有预选书籍按照相似度从大到小进行排序,将排序靠前的预设书籍推荐给用户。
[0012]另一方面,本专利技术一个实施例提供了基于数据分析的版式轻阅读推荐系统,包括的模块如下:数据和标签采集模块,用于采集用户的所有已阅读书籍的标签和用户阅读数据;数据和标签处理模块,用于获取已阅读书籍的标签集合,记为用户标签集合,根据阅读数据获得用户标签集合中每个标签的数量相似度影响因子、时间相似度影响因子、进度相似度影响因子;根据数量相似度影响因子、时间相似度影响因子以及进度相似度影响因子获得每个标签的标签权重;获取预选书籍,将预选书籍的标签和用户标签集合的交集记为交集A,将预选书籍的标签和用户标签集合的差集记为差集B,根据交集A中每个标签的标签权重、差集B中的集合元素数量以及用户标签集合中标签权重均值得到预选书籍的相似度;阅读推荐模块,用于将相似度最大预设数量的预选书籍推荐给用户。
[0013]本专利技术的技术方案的有益效果是:通过分析用户阅读标签下的阅读时长、阅读数量和阅读进度给各个预推荐书籍的标签增加权重,能更准确的找到符合用户阅读习惯和阅读喜好的书籍,从而减少一些无关书籍的推荐。
附图说明
[0014]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015]图1为本专利技术基于数据分析的版式轻阅读推荐方法及系统的步骤流程图。
具体实施方式
[0016]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的基于数据分析的版式轻阅读推荐方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0017]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0018]下面结合附图具体的说明本专利技术所提供的基于数据分析的版式轻阅读推荐方法及系统的具体方案。
[0019]请参阅图1,其示出了本专利技术一个实施例提供的基于数据分析的版式轻阅读推荐方法的步骤流程图,该方法包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于数据分析的版式轻阅读推荐方法,其特征在于,该方法包括以下步骤:采集用户的所有已阅读书籍的标签和用户阅读数据;获取已阅读书籍的标签集合,记为用户标签集合,根据阅读数据获得用户标签集合中每个标签的数量相似度影响因子、时间相似度影响因子、进度相似度影响因子;根据数量相似度影响因子、时间相似度影响因子以及进度相似度影响因子获得每个标签的标签权重;获取预选书籍,将预选书籍的标签和用户标签集合的交集记为交集A,将预选书籍的标签和用户标签集合的差集记为差集B,根据交集A中每个标签的标签权重、差集B中的集合元素数量以及用户标签集合中标签权重均值得到预选书籍的相似度,将相似度最大预设数量的预选书籍推荐给用户。2.根据权利要求1所述基于数据分析的版式轻阅读推荐方法,其特征在于,所述获取已阅读书籍的标签集合,记为用户标签集合,包括的具体步骤如下:用户已阅书籍数量记为n,于是得到n个标签集合,则用户标签集合为:E表示用户标签集合,表示第i本的已阅读书籍标签集合,表示用户预设的感兴趣的书籍标签集合,表示计算集合元素数量的函数,表示求并集。3.根据权利要求1所述基于数据分析的版式轻阅读推荐方法,其特征在于,所述根据阅读数据获得用户标签集合中每个标签的数量相似度影响因子、时间相似度影响因子、进度相似度影响因子,包括的具体步骤如下:用户标签集合中的元素是指书籍标签,表示为,表示第j个书籍标签,集合中书籍标签的数量,用户标签集合下书籍数量的集合表示为,根据用户标签集合下阅读数量计算数量相似度影响因子:根据用户标签集合下阅读数量计算数量相似度影响因子:表示第个标签下的已阅读书籍数量,表示第个标签的数量相似度影响因子;每个用户标签下阅读时长的集合表示为,根据用户标签集合下阅读时长计算时间相似度影响因子:合下阅读时长计算时间相似度影响因子:表示第j个标签下的已阅读书籍的阅读时长,表示第j个标签的时间相似度影响因子;每个用户标签集合下阅读进度的集合表示为M,根据用户标签集合下阅读时长计算进度相似度影响因子:
表示第j个标签下的已阅读书籍平均进度,表示第j个标签的进度相似度影响因子。4.根据权利要求1所述基于数据分析的版式轻阅读推荐方法,其特征在于,所述根...

【专利技术属性】
技术研发人员:张伟赵云朱静宇庄玉龙
申请(专利权)人:北京点聚信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1