The invention discloses a Book similarity calculation method, an electronic device and a storage medium based on random walk, wherein the book similarity calculation method based on random walk includes: obtaining the user interaction behavior data for books; determining the interaction Book sequence corresponding to each user according to the user interaction behavior data; and determining the interaction book sequence corresponding to each user according to the interaction Book sequence corresponding to each user, The book association graph is constructed, and the similarity matrix of each book relative to other books is obtained by random walk calculation based on the book association graph. Based on the user interaction behavior data of books, the technical scheme can construct the book association graph conveniently and conveniently, calculate the random walk according to the book association graph, quickly get the book similarity matrix of each book relative to other books, accurately and effectively reflect the similarity between books from the user's perspective, and effectively improve the calculation accuracy of the book similarity Degree, optimized the book similarity calculation method.
【技术实现步骤摘要】
基于随机游走的书籍相似度计算方法及电子设备
本专利技术涉及数据处理
,具体涉及一种基于随机游走的书籍相似度计算方法、电子设备及存储介质。
技术介绍
电子书形式的书籍由于具有获取方便等优势,受到了大量用户的喜爱。书籍阅读平台大多是按照书籍内容的相似度进行书籍推荐的。现有技术中书籍相似度计算方式大多为对书籍内容进行文本识别、分析等处理,基于分析结果得到书籍之间的相似度。然而,上述书籍相似度计算方式是基于文本内容得到的,无法从用户角度上反映书籍之间的相似度,准确度较差,进而导致在利用书籍之间的相似度进行书籍推荐时所推荐的书籍的采用率较低,推荐效果不佳。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的基于随机游走的书籍相似度计算方法、电子设备及存储介质。根据本专利技术的一个方面,提供了一种基于随机游走的书籍相似度计算方法,包括:获取针对书籍的用户交互行为数据;根据用户交互行为数据,确定每个用户对应的交互书籍序列;根据各个用户对应的交互书籍序列,构造得到书籍关联图;依据书籍关联图进行随机游走计算,得到每本书籍相对于其他书籍的书籍相似度矩阵。根据本专利技术的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行以下操作:获取针对书籍的用户交互行为数据;根据用户 ...
【技术保护点】
1.一种基于随机游走的书籍相似度计算方法,包括:/n获取针对书籍的用户交互行为数据;/n根据所述用户交互行为数据,确定每个用户对应的交互书籍序列;/n根据各个用户对应的交互书籍序列,构造得到书籍关联图;/n依据所述书籍关联图进行随机游走计算,得到每本书籍相对于其他书籍的书籍相似度矩阵。/n
【技术特征摘要】 【专利技术属性】
1.一种基于随机游走的书籍相似度计算方法,包括:
获取针对书籍的用户交互行为数据;
根据所述用户交互行为数据,确定每个用户对应的交互书籍序列;
根据各个用户对应的交互书籍序列,构造得到书籍关联图;
依据所述书籍关联图进行随机游走计算,得到每本书籍相对于其他书籍的书籍相似度矩阵。
2.根据权利要求1所述的方法,所述根据所述用户交互行为数据,确定每个用户对应的交互书籍序列进一步包括:
针对每个用户,对该用户对应的用户交互行为数据进行数据分析,确定该用户交互过的书籍以及书籍交互顺序;
按照所述书籍交互顺序对该用户交互过的书籍进行排列,得到该用户对应的交互书籍序列。
3.根据权利要求2所述的方法,所述根据所述用户交互行为数据,确定每个用户对应的交互书籍序列进一步包括:
针对每个用户,对该用户对应的用户交互行为数据进行数据分析,确定每本书籍对应的交互时长;
从该用户对应的交互书籍序列中筛除交互时长小于预设时长的书籍。
4.根据权利要求1所述的方法,所述根据各个用户对应的交互书籍序列,构造得到书籍关联图进一步包括:
按照书籍交互顺序将各个用户对应的交互书籍序列进行拆分,得到多个书籍关联对,该书籍关联对包含任两本书籍及其关联关系;
对各个书籍关联对对应的用户数量进行统计,得到各个书籍关联对的关联权重值;
按照各个书籍关联对,确定各本书籍之间的边,并依据各个书籍关联对的关联权重值,确定各个边的边权重值,构造得到书籍关联图;所述书籍关联图具体为有向图或者无向图。
5.根据权利要求1所述的方法,所述依据所述书籍关联图进行随机游走计算,得到每本书籍相对于其他书籍的书籍相似度矩阵进一步包括:
针对所述书籍关联图中的每本书籍,从所述书籍关联图中查找与该书籍具有关联关系的其他书籍;
根据与该书籍具有关联关系的其他书籍,构造该书籍对应的深度树;
根据所述书籍关联图中该书籍与其他书籍之间的边的边权重值,计算该书籍对应的深度树中各层节点书籍之间的边的游走概率;
对该书籍对应的深度树进行随机游走计算,得到该书籍相对于其他书籍的书籍相似度矩阵。
6.根据权利要求5所述的方法,所述根据与该书籍具有关联关系的其他书籍,构造该书籍对应的深度树进一步包括:
技术研发人员:王海璐,曹雯潇,
申请(专利权)人:掌阅科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。