电子书相似度计算方法、电子设备及存储介质技术

技术编号:33780220 阅读:35 留言:0更新日期:2022-06-12 14:34
本发明专利技术公开了一种电子书相似度计算方法、电子设备及存储介质,方法包括:获取第一电子书的第一历史用户,以及,第二电子书的第二历史用户,确定包含第一历史用户和第二历史用户间共同用户的用户列表;根据用户列表中任两用户的历史行为信息,筛选任两用户间存在的相同电子书,确定共同电子书数据;根据用户列表中用户对电子书的历史行为信息计算得到用户对电子书的负相关权重因子;根据任两用户的共同电子书数据及负相关权重因子,对用户列表进行用户循环计算,得到第一电子书与第二电子书的相似度。根据共同电子书数据挖掘电子书间相似度;利用用户历史行为信息计算电子书的负相关权重因子,调整用户行为对电子书相似度的影响,使其更准确。使其更准确。使其更准确。

【技术实现步骤摘要】
电子书相似度计算方法、电子设备及存储介质


[0001]本专利技术涉及电子书领域,具体涉及一种电子书相似度计算方法、电子设备及存储介质。

技术介绍

[0002]电子书提供给用户便捷的阅读体验,选择电子书阅读的用户也越来越多。用户在阅读时会根据自身的喜好选择电子书。电子书推荐可以帮助用户更快速地找到喜爱的电子书,减少用户查找时间。
[0003]为用户进行电子书推荐时,一般根据用户对电子书喜好为其推荐相似类型的电子书。因此,电子书推荐时需要先确定电子书间的相似度。现有技术在确定电子书的相似度时,大多基于用户的阅读行为确定。如不同用户都阅读了电子书1和电子书2,从侧面说明电子书1和电子书2间具有一定的相似度。但这种方式也存在缺陷,如不同用户阅读的电子书中仅电子书1和电子书2是相同的,不同用户的阅读喜好也可能存在比较大的差异,仅根据以上方式确定的电子书1和电子书2之间的相似度不准确,导致推荐的电子书不能满足用户需求,点击率也较低。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种电子书相似度计算方法,其包括:获取第一电子书的第一历史用户,以及,第二电子书的第二历史用户,确定包含第一历史用户和第二历史用户间共同用户的用户列表;根据所述用户列表中任两用户的历史行为信息,筛选任两用户间存在的相同电子书,确定共同电子书数据;根据所述用户列表中用户对电子书的历史行为信息计算得到用户对电子书的负相关权重因子;根据任两用户的共同电子书数据及负相关权重因子,对所述用户列表进行用户循环计算,得到第一电子书与第二电子书的相似度。2.根据权利要求1所述的方法,其中,所述历史行为信息包括历史电子书及用户与电子书的交互信息;所述负相关权重因子包括时间衰减因子,所述时间衰减因子根据用户与电子书的交互信息中的时间信息计算得到。3.根据权利要求2所述的方法,其中,所述用户与电子书的交互信息包括电子书的阅读时间;所述根据所述用户列表中用户对电子书的历史行为信息计算得到用户对电子书的负相关权重因子进一步包括:获取用户阅读第一电子书的第一阅读时间,以及阅读第二电子书的第二阅读时间;根据所述第一阅读时间与所述第二阅读时间的阅读时间差、阅读时间系数,计算得到电子书的时间衰减因子;其中,所述阅读时间差与所述时间衰减因子成反比。4.根据权利要求2所述的方法,其中,所述用户与电子书的交互信息包括电子书加入书架的书架时间;所述根据所述用户列表中用户对电子书的历史行为信息计算得到用户对电子书的负相关权重因子进一步包括:获取用户将第一电子书加入书架的第一书架时间,以及将第二电子书加入书架的第二书架时间;根据所述第一书架时间与所述第二书架时间的书架时间差、书架时间系数,计算得到电子书的时间衰减因子;其中,所述书架时间差与所述时间衰减因子成反比。5.根据权利要求1

4中任一项所述的方法,其中,所述负相关权重因子还包括用户高热惩罚因子;所述根据所述用户列表中用户对电子书的历史行为信息计算得到用户对电子书的负相关权重因子进一步包括:以用户为单位统计所述用户列表中用户的历史行为信息中交互的电子书的数量;根据所述数量,降权计算得到电子...

【专利技术属性】
技术研发人员:朱滕威王海璐
申请(专利权)人:掌阅科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1