基于数据分析的版式轻阅读推荐方法及系统技术方案

技术编号：38598413 阅读：15 留言：0更新日期：2023-08-26 23:33

本发明专利技术涉及数据处理技术领域，具体涉及基于数据分析的版式轻阅读推荐方法及系统，包括：获取阅读数据的标签集合，记为用户标签集合，根据用户的阅读数量、阅读时长、阅读进度得到三个相似度影响因子；根据预选书籍的标签集合和相似度影响因子计算改进Jaccard相似度；将改进Jaccard相似度最大预设数量的预选书籍推荐给用户。本发明专利技术根据相似度影响因子得到改进Jaccard相似度，使用Jaccard相似度提升版式轻阅读推荐方法及系统的准确度。轻阅读推荐方法及系统的准确度。轻阅读推荐方法及系统的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
基于数据分析的版式轻阅读推荐方法及系统

[0001]本专利技术涉及数据处理
，具体涉及基于数据分析的版式轻阅读推荐方法及系统。

技术介绍

[0002]轻阅读智能推荐是一种基于数据分析技术的阅读推荐系统。它可以根据用户的兴趣、阅读历史和行为等信息，为用户推荐相关的文章、图书、新闻等内容，帮助用户更快、更准确地找到自己感兴趣的信息。轻阅读智能推荐的优点在于，它可以帮助用户节省时间和精力，避免在大量信息中寻找自己需要的内容。同时，它也可以帮助用户发现新的、有趣的内容，拓展自己的知识和视野。
[0003]现有的轻阅读推荐系统是利用Jaccard相似度算法根据预推荐书籍标签与用户注册账户时选择的兴趣标签以及已阅读书籍所含标签的交集占比大小来推荐书籍的，但是标签推荐系统只能基于已有的标签进行推荐，而无法考虑其他因素，如用户的历史行为、个人喜好等，且标签具有偏差性，每阅读完一本新的书籍就有可能出现新用户不感兴趣的标签，使阅读推荐书籍标签不具有代表性。

技术实现思路

[0004]本专利技术提供基于数据分析的版式轻阅读推荐方法及系统，以解决现有的问题。
[0005]本专利技术的基于数据分析的版式轻阅读推荐方法及系统采用如下技术方案：一方面，本专利技术一个实施例提供了基于数据分析的版式轻阅读推荐方法，该方法包括以下步骤：采集用户的所有已阅读书籍的标签和用户阅读数据；获取已阅读书籍的标签集合，记为用户标签集合，根据阅读数据获得用户标签集合中每个标签的数量相似度影响因子、时间相似度影响因子、进度相似度影...

【技术保护点】

【技术特征摘要】
1.基于数据分析的版式轻阅读推荐方法，其特征在于，该方法包括以下步骤：采集用户的所有已阅读书籍的标签和用户阅读数据；获取已阅读书籍的标签集合，记为用户标签集合，根据阅读数据获得用户标签集合中每个标签的数量相似度影响因子、时间相似度影响因子、进度相似度影响因子；根据数量相似度影响因子、时间相似度影响因子以及进度相似度影响因子获得每个标签的标签权重；获取预选书籍，将预选书籍的标签和用户标签集合的交集记为交集A，将预选书籍的标签和用户标签集合的差集记为差集B，根据交集A中每个标签的标签权重、差集B中的集合元素数量以及用户标签集合中标签权重均值得到预选书籍的相似度，将相似度最大预设数量的预选书籍推荐给用户。2.根据权利要求1所述基于数据分析的版式轻阅读推荐方法，其特征在于，所述获取已阅读书籍的标签集合，记为用户标签集合，包括的具体步骤如下：用户已阅书籍数量记为n，于是得到n个标签集合，则用户标签集合为：E表示用户标签集合，表示第i本的已阅读书籍标签集合，表示用户预设的感兴趣的书籍标签集合，表示计算集合元素数量的函数，表示求并集。3.根据权利要求1所述基于数据分析的版式轻阅读推荐方法，其特征在于，所述根据阅读数据获得用户标签集合中每个标签的数量相似度影响因子、时间相似度影响因子、进度相似度影响因子，包括的具体步骤如下：用户标签集合中的元素是指书籍标签，表示为，表示第j个书籍标签，集合中书籍标签的数量，用户标签集合下书籍数量的集合表示为，根据用户标签集合下阅读数量计算数量相似度影响因子：根据用户标签集合下阅读数量计算数量相似度影响因子：表示第个标签下的已阅读书籍数量，表示第个标签的数量相似度影响因子；每个用户标签下阅读时长的集合表示为，根据用户标签集合下阅读时长计算时间相似度影响因子：合下阅读时长计算时间相似度影响因子：表示第j个标签下的已阅读书籍的阅读时长，表示第j个标签的时间相似度影响因子；每个用户标签集合下阅读进度的集合表示为M，根据用户标签集合下阅读时长计算进度相似度影响因子：
表示第j个标签下的已阅读书籍平均进度，表示第j个标签的进度相似度影响因子。4.根据权利要求1所述基于数据分析的版式轻阅读推荐方法，其特征在于，所述根...

【专利技术属性】
技术研发人员：张伟，赵云，朱静宇，庄玉龙，
申请(专利权)人：北京点聚信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人