【技术实现步骤摘要】
小说转码方法、装置、设备以及存储介质
[0001]本公开涉及互联网
,尤其涉及大数据和智能搜索等
,可以应用于小说转码场景。具体涉及一种小说转码方法、装置、设备以及存储介质。
技术介绍
[0002]服务器中存储的小说文本通常不是用户可以直接阅读的格式,因而在阅读终端展示小说文本时,需要转码一下才可以生成用户能够看懂的文本格式。因此,小说转码是指转换文本格式,将小说转换到阅读终端支持的格式进行展示。
技术实现思路
[0003]本公开提供了一种小说转码方法、装置、设备、存储介质以及计算机程序产品。
[0004]根据本公开的一方面,提供了一种小说转码方法,包括:查找与目标小说关联的至少一个网页地址;获取与所述至少一个网页地址一一对应的至少一个目录信息;基于所述至少一个目录信息进行目录聚合,以生成所述目标小说的章节关系图;以及基于所述章节关系图,获取所述目标小说的最优目录,以便基于所述最优目录,为用户请求访问的小说章节选取对应的最优正文进行转码。
[0005]根据本公开的另一方面,提供了一 ...
【技术保护点】
【技术特征摘要】
1.一种小说转码方法,包括:查找与目标小说关联的至少一个网页地址;获取与所述至少一个网页地址一一对应的至少一个目录信息;基于所述至少一个目录信息进行目录聚合,以生成所述目标小说的章节关系图;以及基于所述章节关系图,获取所述目标小说的最优目录,以便基于所述最优目录,为用户请求访问的小说章节选取对应的最优正文进行转码。2.根据权利要求1所述的方法,其中,基于所述至少一个目录信息进行目录聚合,以生成所述目标小说的章节关系图,包括:针对所述至少一个目录信息中的每个目录信息,执行预处理操作,以获得对应的预处理后的目录信息,其中,所述预处理操作包括以下至少之一:章节去重操作、章节补全操作;以及基于预处理后得到的至少一个目录信息进行目录聚合,以生成所述章节关系图。3.根据权利要求2所述的方法,其中,基于预处理后得到的至少一个目录信息进行目录聚合,以生成所述章节关系图,包括:基于所述预处理后得到的至少一个目录信息,按照章节顺序建立章节关系树;以及合并所述章节关系树中章节标题主体相同的节点,得到至少一个聚合节点;以及基于所述至少一个聚合节点,生成所述章节关系图。4.根据权利要求3所述的方法,其中,基于所述章节关系图,获取所述目标小说的最优目录,包括:从所述章节关系图的首节点开始,查找该节点的子节点并选取聚合节点个数最多的子节点作为下一节点,如此直到查找到叶子节点为止,此过程经过的路径作为所述最优目录。5.根据权利要求1所述的方法,还包括:缓存所述最优目录。6.根据权利要求1至5中任一项所述的方法,还包括:响应于用户针对所述目标小说发起转码请求,基于所述最优目录,为用户请求访问的小说章节选取对应的最优正文进行转码。7.根据权利要求6所述的方法,其中,基于所述最优目录,为用户请求访问的小说章节选取对应的最优正文进行转码,包括:确定所述最优目录中与所述用户请求访问的小说章节对应的聚合章节;获取与所述聚合章节关联的至少一个章节正文网页链接;基于所述至少一个章节正文网页链接,获取一一对应的至少一个章节正文;基于内容质量,从所述至少一个章节正文中选出最优的一个章节正文;以及将所述最优的一个章节正文转码给用户。8.根据权利要求1所述的方法,其中,查找与目标小说关联的至少一个网页地址,包括:确定所述目标小说所属的书籍集合,其中,所述书籍集合中包含的每个小说与所述目标小说均为来源不同的同一小说,所述每个小说对应的网页地址均与所述目标小说关联;以及查找所述每个小说对应的网页地址。9.一种小说转码装置,包括:
查找模块,用于查找与目标小说关联的至少一个网页地址;第一获取模块,用于获取与所述至少一个网页地址一一对应的至少一个目录信息;聚合模块,用于基于所述至少一个目录信息进行目录聚合,生成所述目标小说的章节关系图;以及第二获取模块,用于基于所述章节关系图,获取所述目标小说的最优目录,以便基于所述最优目录,...
【专利技术属性】
技术研发人员:柳正青,赵旭,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。