【技术实现步骤摘要】
ePub文件格式转换方法、装置、设备及可读存储介质
[0001]本专利技术涉及数据处理
,特别涉及一种ePub文件格式转换方法、装置、设备及可读存储介质。
技术介绍
[0002]ePub(英文全称:Electronic Publication,中文全称:电子出版)是一个自由的开放标准,属于一种可以“自动重新编排”的内容,也就是文字内容可以根据阅读设备的特性,以最适于阅读的方式显示。因此,目前很多客户端阅读只支持ePub格式文件,用户在上传文件时需要先将其他格式的文件转换为ePub文件格式才能上传。
[0003]目前而言,ePub格式文件的转换涉及复杂的运算及代码转换,不仅过程繁杂,而且容易损失文件内容,同时还需要大量人工参与,导致效率非常的低下。
技术实现思路
[0004]为解决上述技术问题,本专利技术提供一种ePub文件格式转换方法、装置、设备及可读存储介质,能够兼容多格式的文件转换,减少人工处理,提高转换效率。
[0005]本专利技术一方面提供一种ePub文件格式转换方法,包括:r/>[0006]获本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种ePub文件格式转换方法,其特征在于,包括:获取待转换文件中包含的文件内容;对所述文件内容进行关键词过滤,得到过滤后的文件内容;拆分过滤后的所述文件内容中的文本元素和图像元素,并生成章节目录及所述章节目录对应的内容目录;根据所述章节目录及所述内容目录,对所述文本元素和所述图像元素进行组合,生成ePub格式文件。2.根据权利要求1所述的ePub文件格式转换方法,其特征在于,所述对所述文件内容进行关键词过滤,得到过滤后的文件内容,包括:将所述文件内容中的词汇逐一与预设语料库中的关键词进行相似性比对,得到相似性比对结果;将相似性比对结果符合预设条件的词汇替换为随机字符,得到过滤后的文件内容。3.根据权利要求1所述的ePub文件格式转换方法,其特征在于,在对所述文件内容进行关键词过滤,得到过滤后的文件内容之后,所述方法还包括:对过滤后的所述文件内容进行解析,得到过滤后的所述文件内容对应的文件编码和文件大小。4.根据权利要求1所述的ePub文件格式转换方法,其特征在于,所述根据所述章节目录及所述内容目录,对所述文本元素和所述图像元素进行组合,生成ePub格式文件,包括:根据所述章节目录及所述内容目录,将所述文本元素和所述图像元素放入预设HTML模板中,生成HTML格式文件;根据所述HTML格式文件,生成ePub格式文件。5.根据权利要求1所述的ePub文件格式转换方法...
【专利技术属性】
技术研发人员:李政军,陈娅芳,
申请(专利权)人:湖南新云网科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。