当前位置: 首页 > 专利查询>北京大学专利>正文

基于ePub文件的试读方法和基于ePub文件的试读系统技术方案

技术编号:14061239 阅读:38 留言:0更新日期:2016-11-27 18:08
本发明专利技术提出了一种基于ePub文件的试读方法和一种基于ePub文件的试读系统,其中,所述方法包括:获取ePub文件的整体目录索引文件;解析所述整体目录索引文件,以获取所述整体目录索引文件中的每个子目录索引文件对应的HTML文件内容的第一文件大小;根据目标比例确定试读ePub文件的第二文件大小;根据所述第一文件大小和所述第二文件大小确定所述试读ePub文件的试读目录结构,以获取所述试读ePub文件。通过本发明专利技术的技术方案,通过将ePub文件的整体目录索引文件解析成多个子目录索引文件,从而根据每个子目录索引文件对应的HTML文件内容的大小和目标比例所确定的试读ePub文件的大小,可以有效且快速地获取试读ePub文件,进而实现了对ePub文件进行批量快速地处理。

【技术实现步骤摘要】

本专利技术涉及文件的试读方法
,具体而言,涉及一种基于ePub文件的试读方法和一种基于ePub文件的试读系统。
技术介绍
目前,ePub(Electronic Publication,电子出版)是一个自由的开放标准,属于一种可以“自动重新编排”的内容,也就是文字内容可以根据阅读设备的特性,以最适于阅读的方式显示。ePub档案内部使用了XHTML(Extensible Hyper Text Markup Language,可扩展超文本标记语言)或DTBook(一种由Daisy Consortium提出的XML标准,其中XML为可扩展标记语言)来展现文字,并以zip压缩格式来包裹档案内容。在相关的技术方案中,为了获取试读ePub文件,ePub文件的解析方式主要有两种,即解压式和直接式(相对叫法),大多数书籍阅读器都选择了解压式(包括iOS平台上的Ibooks),在某一个位置可以找到整一本书的完整解压文档,但是,解压式获取试读ePub文件有一定的缺点,即对缓存位置的读写速度有一定要求:如果解压(包括运算、写入文件)速度比较慢,那么首次打开的速度也就被迫拖慢,加上渲染、排版等,首次打开的时间就会很长,即使第二次打开的速度比第一次快一些,但是依然会导致用户不好的体验。因此,如何有效快速地获取试读ePub文件,从而实现了对ePub文件进行批量快速地处理,进而提升用户体验成为亟待解决的问题。
技术实现思路
本专利技术正是基于上述问题,提出了一种新的技术方案,通过将ePub文件的整体目录索引文件解析成多个子目录索引文件,从而根据每个子目
录索引文件对应的HTML文件内容的大小和目标比例所确定的试读ePub文件的大小,可以有效且快速地获取试读ePub文件,进而实现了对ePub文件进行批量快速地处理,提升了用户体验。有鉴于此,本专利技术的一方面提出了一种基于ePub文件的试读方法,包括:获取ePub文件的整体目录索引文件;解析所述整体目录索引文件,以获取所述整体目录索引文件中的每个子目录索引文件对应的HTML文件内容的第一文件大小;根据目标比例确定试读ePub文件的第二文件大小;根据所述第一文件大小和所述第二文件大小确定所述试读ePub文件的试读目录结构,以获取所述试读ePub文件。在该技术方案中,通过将ePub文件的整体目录索引文件解析成多个子目录索引文件,且每个子目录索引文件对应有HTML(Hyper Text Markup Language,超文本标记语言)文件内容,从而可以按照目标比例获取与试读ePub文件的第二文件大小对应的HTML文件内容,进而可以有效且快速地获取试读ePub文件,实现了对ePub文件进行批量快速地处理,可以提升用户体验。在上述技术方案中,优选地,获取所述ePub文件的所述整体目录索引文件,具体包括:将所述ePub文件解压至目标路径中;在所述目标路径中,获取所述ePub文件的打包索引文件;解析所述打包索引文件,以获取所述打包索引文件中指定代码文件的标签内容;解析所述标签内容,以获取所述指定代码文件的文件路径;根据所述文件路径获取所述整体目录索引文件。在该技术方案中,根据ePub文件的打包索引文件中指定代码文件的标签内容,获取所述指定代码文件的文件路径,从而可以根据文件路径获取整体目录索引文件,进而为获取整体目录索引文件中的每个子目录索引文件对应的HTML文件内容的第一文件大小奠定了基础,即为有效且快速地获取试读ePub文件奠定了基础。在上述技术方案中,优选地,获取所述每个子目录索引文件对应的HTML文件的所述第一文件大小,具体包括:解析所述整体目录索引文件的XML格式至目标对象中;获取所述整体目录索引文件中的目录结构标
签,以解析与所述目录结构标签对应的节点列表;根据所述节点列表的目录标签获取对应的所述每个子目录索引文件对应的HTML文件的每个锚点位置;根据所述每个锚点位置解析所述每个子目录索引文件对应的HTML文件的文件内容,确定所述第一文件大小。在该技术方案中,对解析所述整体目录索引文件进行解析,以根据每个子目录索引文件对应的HTML文件的每个锚点位置确定第一文件大小,为有效且快速地获取试读ePub文件奠定了基础,从而实现了对ePub文件进行批量快速地处理,可以提升用户体验。在上述技术方案中,优选地,根据所述第一文件大小和所述第二文件大小确定所述试读ePub文件的所述试读目录结构,具体包括:循环累加所述第一文件大小,以得到目标文件大小;判断所述目标文件大小是否大于或等于所述第二文件大小;在判断结果为是时,停止循环累加所述第一文件大小,并确定所述试读ePub文件的所述试读目录结构。在该技术方案中,由于循环累加的算法比较简单,因此,通过循环累加可以快速地确定试读ePub文件的试读目录结构,从而就可以根据该试读目录结构快速地获取试读ePub文件,进而实现了对ePub文件进行批量快速地处理,可以提升用户体验,优选地,试读ePub文件=与整体目录索引文件对应的HTML文件内容的大小×目标比例。在上述技术方案中,优选地,在所述目标路径下,将除与所述试读目录结构对应的HTML文件内容以外的剩余HTML文件内容删除,以获取所述试读ePub文件。在该技术方案中,由于除与试读目录结构对应的HTML文件内容以外的剩余HTML文件内容并不会出现在试读ePub文件中,因此,在目标路径下,可以将剩余HTML文件内容删除,从而可以节省试读ePub文件所占用的内存,进而节省了整个系统所占用的内存。本专利技术的另一方面提出了一种基于ePub文件的试读系统,包括:第一获取模块,用于获取ePub文件的整体目录索引文件;第一解析模块,用于解析所述整体目录索引文件,以获取所述整体目录索引文件中的每个子目录索引文件对应的HTML文件内容的第一文件大小;计算模块,用
于根据目标比例确定试读ePub文件的第二文件大小;第一确定模块,用于根据所述第一文件大小和所述第二文件大小确定所述试读ePub文件的试读目录结构,以获取所述试读ePub文件。在该技术方案中,通过将ePub文件的整体目录索引文件解析成多个子目录索引文件,且每个子目录索引文件对应有HTML文件内容,从而可以按照目标比例获取与试读ePub文件的第二文件大小对应的HTML文件内容,进而可以有效且快速地获取试读ePub文件,实现了对ePub文件进行批量快速地处理,可以提升用户体验。在上述技术方案中,优选地,所述第一获取模块包括:解压模块,用于将所述ePub文件解压至目标路径中;第二获取模块,用于在所述目标路径中,获取所述ePub文件的打包索引文件;第二解析模块,用于解析所述打包索引文件,以获取所述打包索引文件中指定代码文件的标签内容,以及解析所述标签内容,以获取所述指定代码文件的文件路径;以及所述第二获取模块还用于:根据所述文件路径获取所述整体目录索引文件。在该技术方案中,根据ePub文件的打包索引文件中指定代码文件的标签内容,获取所述指定代码文件的文件路径,从而可以根据文件路径获取整体目录索引文件,进而为获取整体目录索引文件中的每个子目录索引文件对应的HTML文件内容的第一文件大小奠定了基础,即为有效且快速地获取试读ePub文件奠定了基础。在上述技本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201510191255.html" title="基于ePub文件的试读方法和基于ePub文件的试读系统原文来自X技术">基于ePub文件的试读方法和基于ePub文件的试读系统</a>

【技术保护点】
一种基于ePub文件的试读方法,其特征在于,包括:获取ePub文件的整体目录索引文件;解析所述整体目录索引文件,以获取所述整体目录索引文件中的每个子目录索引文件对应的HTML文件内容的第一文件大小;根据目标比例确定试读ePub文件的第二文件大小;根据所述第一文件大小和所述第二文件大小确定所述试读ePub文件的试读目录结构,以获取所述试读ePub文件。

【技术特征摘要】
1.一种基于ePub文件的试读方法,其特征在于,包括:获取ePub文件的整体目录索引文件;解析所述整体目录索引文件,以获取所述整体目录索引文件中的每个子目录索引文件对应的HTML文件内容的第一文件大小;根据目标比例确定试读ePub文件的第二文件大小;根据所述第一文件大小和所述第二文件大小确定所述试读ePub文件的试读目录结构,以获取所述试读ePub文件。2.根据权利要求1所述的基于ePub文件的试读方法,其特征在于,获取所述ePub文件的所述整体目录索引文件,具体包括:将所述ePub文件解压至目标路径中;在所述目标路径中,获取所述ePub文件的打包索引文件;解析所述打包索引文件,以获取所述打包索引文件中指定代码文件的标签内容;解析所述标签内容,以获取所述指定代码文件的文件路径;根据所述文件路径获取所述整体目录索引文件。3.根据权利要求1所述的基于ePub文件的试读方法,其特征在于,获取所述每个子目录索引文件对应的HTML文件的所述第一文件大小,具体包括:解析所述整体目录索引文件的XML格式至目标对象中;获取所述整体目录索引文件中的目录结构标签,以解析与所述目录结构标签对应的节点列表;根据所述节点列表的目录标签获取对应的所述每个子目录索引文件对应的HTML文件的每个锚点位置;根据所述每个锚点位置解析所述每个子目录索引文件对应的HTML文件的文件内容,确定所述第一文件大小。4.根据权利要求2或3所述的基于ePub文件的试读方法,其特征在于,根据所述第一文件大小和所述第二文件大小确定所述试读ePub文件
\t的所述试读目录结构,具体包括:循环累加所述第一文件大小,以得到目标文件大小;判断所述目标文件大小是否大于或等于所述第二文件大小;在判断结果为是时,停止循环累加所述第一文件大小,并确定所述试读ePub文件的所述试读目录结构。5.根据权利要求4所述的基于ePub文件的试读方法,其特征在于,在所述目标路径下,将除与所述试读目录结构对应的HTML文件内容以外的剩余HTML文件内容删除,以获取所述试读ePub文件。6.一种基于ePub文件的试读系统,其特征在于,包括:第一获取模块,用...

【专利技术属性】
技术研发人员:李辰
申请(专利权)人:北京大学北大方正集团有限公司北京北大方正电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1