一种epub文件生成方法和系统技术方案

技术编号:22722373 阅读:26 留言:0更新日期:2019-12-04 05:27
本发明专利技术提出了一种epub文件生成方法和系统,通过定义统一的epub文件目录,可以将不同来源的数据进行统一管理,并且定义统一的epub文件目录还包括directories.json文件,directories.json文件涵盖epub元数据、目录信息和资源地址信息等,使得信息交换更轻便,能取代原来epub复杂解析的方式,只用解析该文件即可,因而能使epub文件的阅读不受平台限制,随意浏览章节内容;本发明专利技术定义统一格式化epub目录,可以接受多种信息来源,组织好文本数据后,可以批量进行生产epub,避免了epub粗放式的制作与管理带来诸多弊端。

An ePub file generation method and system

The invention proposes a method and system for generating ePub files. By defining a unified ePub file directory, the data from different sources can be managed uniformly, and the unified ePub file directory also includes the directories.json file, and the directories.json file covers the ePub metadata, directory information, resource address information, etc., which makes information exchange more portable and can replace the original e In the way of pub complex parsing, only the file can be parsed, so that the reading of the ePub file is not limited by the platform, and the chapter content can be browsed at will; the definition of the invention unifies the format of the ePub directory, which can accept multiple information sources, and after the text data is organized, the ePub can be produced in batches, avoiding many disadvantages brought by the extensive production and management of the ePub.

【技术实现步骤摘要】
一种epub文件生成方法和系统
本专利技术涉及电子出版物领域,尤其涉及一种epub文件生成方法和系统。
技术介绍
现如今,海量电子出版物是以epub这种文件格式为载体的,epub作为电子出版物的重要标准之一,已被广泛接纳。epub是一个自由的开放标准,属于一种可以“自动重新编排”的内容;也就是文字内容可以根据阅读设备的特性,以最适于阅读的方式显示;epub拥有广泛的阅读平台支持,比如能直接被浏览器打开阅读,以及各类跨平台的epub-阅读器,这使得epub电子读物越来越活跃;拥有众多跨平台的epub制作软件,比如Sigil、epubBuilder等,无疑加快了epub电子读物的工业化生产。虽然epub电子读物已获得广泛的平台支持,但是其自由的开放标准催生出各种制作软件,受限于数据来源形式、制作人员使用软件的效率和熟练程度,难免出现制作效率低,错误率增加的情况,继而导致格式不统一,无法对资源进行集约式管理。因此,为解决上述问题,本专利技术提供一种epub文件生成方法和系统,统一格式化epub目录,接受多种信息来源,并组织好文本数据,批量进行生产epub,避免了epub粗放式的制作与管理带来诸多弊端。
技术实现思路
有鉴于此,本专利技术提出了一种epub文件生成方法和系统,统一格式化epub目录,接受多种信息来源,并组织好文本数据,批量进行生产epub,避免了epub粗放式的制作与管理带来诸多弊端。本专利技术的技术方案是这样实现的:一方面,本专利技术提供了一种epub文件生成方法,包括以下步骤:S1、定义统一的epub文件目录;S2、接收不同来源的数据,获取元数据并初始化所有元数据;S3、按照统一的epub文件目录填充元素。在以上技术方案的基础上,优选的,S1中统一的epub文件目录包括META-INF目录、OEBPS目录、mimetype文件和directories.json文件;META-INF目录包括container.xml文件,OEBPS目录包括content.opf文件和toc.ncx文件。在以上技术方案的基础上,优选的,S2的数据来源是数据库或者现有的epub文件;若数据来源是数据库时,直接进行初始化;若数据来源是已存在的epub文件时,先解析现有的epub文件,获取所有的元数据后再进行初始化。进一步优选的,S3中具体包括以下步骤:S201、新建container.xml文件、mimetype文件、content.opf文件和toc.ncx文件;S202、将引到content.opf文件的相对路径写入container.xml文件,将epub文件的文件格式写入mimetype文件中,将epub文件中所有的资源路径写入content.opf文件中,将epub文件的目录信息写入toc.ncx文件中;S203、新建directories.json文件,将content.opf文件中的资源路径和toc.ncx文件中的目录信息转义成json格式,并存放在directories.json文件中;S204、生成css和js静态文件,再经zip压缩生成epub文件。另一方面,本专利技术提供一种epub文件生成系统,包括顺次信号连接的接收模块、构造模块、转义模块和格式转换模块;接收模块接收不同来源的数据,并提取所有的元数据,将元数据传输给构造模块;构造模块架设epub文件的目录信息,配置目录下的文件的属性,接收接收模块传输的元数据,并根据目录以及文件属性填充目录;转义模块按照json格式的规范将元数据和目录信息转成json格式,并存放在json文件中;格式转换模块将json格式的信息转换成用户所需的格式。在以上技术方案的基础上,优选的,接收模块包括解压单元;解压单元将现有的epub文件解压,并获取所需的元数据,将元数据传输给构造模块。在以上技术方案的基础上,优选的,构造模块架设epub文件的目录信息包括META-INF目录和OEBPS目录;META-INF目录包括container.xml文件,OEBPS目录包括content.opf文件和toc.ncx文件。进一步优选的,content.opf文件包括:metadata元数据信息、manifest文件列表、spine脊骨、guide指南和tour导读;content.opf文件配置有package标签,metadata元数据信息配置有metadata标签,manifest文件列表配置有manifest子标签,spine脊骨配置有spine标签,guide指南配置有guide标签。进一步优选的,构造模块包括顺次信号连接的opf文件生成单元和ncx文件生成单元;opf文件生成单元接收接收模块传输的元数据,依次生成package标签和metadata标签,再遍历元数据生成文章的阅读页面xhtml,添加图片静态资源的访问路径至manifest子标签中;ncx文件生成单元根据目录信息递归生成epub目录导航文件;opf文件生成单元的输入端与接收模块的输出端信号连接,opf文件生成单元的输出端和ncx文件生成单元的输出端分别与转义模块的输入端信号连接。本专利技术的一种epub文件生成方法和系统相对于现有技术具有以下有益效果:(1)通过定义统一的epub文件目录,可以将不同来源的数据进行统一管理,并且定义统一的epub文件目录还包括directories.json文件,directories.json文件涵盖epub元数据、目录信息和资源地址信息等,使得信息交换更轻便,能取代原来epub复杂解析的方式,只用解析该文件即可,因而能使epub文件的阅读不受平台限制,随意浏览章节内容;(2)在读取或转换epub文件时,使用json格式读取epub文件,不会破坏资源之间的引用路径信息,并且由于json是一种轻量级的数据交换格式,任意格式的信息均可以转换成json格式,因此,适用任意平台;(3)本专利技术定义统一格式化epub目录,可以接受多种信息来源,组织好文本数据后,可以批量进行生产epub,避免了epub粗放式的制作与管理带来诸多弊端。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一种epub文件生成方法中定义统一的epub文件目录结构;图2为本专利技术一种epub文件生成方法的流程图;图3为本专利技术一种epub文件生成方法中按照统一的epub文件目录填充元素的流程图;图4为本专利技术一种epub文件生成方法中生成content.opf文件的流程图;图5为本专利技术一种epub文件生成方法中生成toc.ncx文本文档来自技高网...

【技术保护点】
1.一种epub文件生成方法,其特征在于:包括以下步骤:/nS1、定义统一的epub文件目录;/nS2、接收不同来源的数据,获取元数据并初始化所有元数据;/nS3、按照统一的epub文件目录填充元素。/n

【技术特征摘要】
1.一种epub文件生成方法,其特征在于:包括以下步骤:
S1、定义统一的epub文件目录;
S2、接收不同来源的数据,获取元数据并初始化所有元数据;
S3、按照统一的epub文件目录填充元素。


2.如权利要求1所述的一种epub文件生成方法,其特征在于:所述S1中统一的epub文件目录包括META-INF目录、OEBPS目录、mimetype文件和directories.json文件;
所述META-INF目录包括container.xml文件,OEBPS目录包括content.opf文件和toc.ncx文件。


3.如权利要求1所述的一种epub文件生成方法,其特征在于:所述S2的数据来源是数据库或者现有的epub文件;
若数据来源是数据库时,直接进行初始化;若数据来源是已存在的epub文件时,先解析现有的epub文件,获取所有的元数据后再进行初始化。


4.如权利要求2所述的一种epub文件生成方法,其特征在于:所述S3中具体包括以下步骤:
S201、新建container.xml文件、mimetype文件、content.opf文件和toc.ncx文件;
S202、将引到content.opf文件的相对路径写入container.xml文件,将epub文件的文件格式写入mimetype文件中,将epub文件中所有的资源路径写入content.opf文件中,将epub文件的目录信息写入toc.ncx文件中;
S203、新建directories.json文件,将content.opf文件中的资源路径和toc.ncx文件中的目录信息转义成json格式,并存放在directories.json文件中;
S204、生成css和js静态文件,再经zip压缩生成epub文件。


5.一种epub文件生成系统,其特征在于,包括顺次信号连接的接收模块、构造模块、转义模块和格式转换模块;
所述接收模块接收不同来源的数据,并提取所有的元数据,将元数据传输给构造模块;
...

【专利技术属性】
技术研发人员:周斌
申请(专利权)人:武汉鼎森电子科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1