【技术实现步骤摘要】
基于电子书的排版处理方法、电子设备及存储介质
本专利技术涉及计算机领域,具体涉及一种基于电子书的排版处理方法、电子设备及存储介质。
技术介绍
在电子书排版过程中,需要针对版式排版的电子书原稿进行识别,并根据识别结果通过流式排版方式实现自定义效果的排版。其中,电子书原稿通常为PDF等不可编辑的格式。在针对电子书原稿进行识别的过程中,能够自动识别出原稿中的各种页面元素,具体包括文字类元素、图片类元素等多种类型。然后,根据识别结果自动转换至流式文档中实现自定义排版。但是,在实现本专利技术的过程中,专利技术人发现现有技术中的上述方案至少存在下述缺陷:为了丰富图片的展示效果,电子书中的部分图片并非由单一的图片元素构成,而是通过一些其他类型的页面元素组合而成。相应地,若直接根据解析得到的各个页面元素进行排版,则会破坏图片本身的构图方式,从而使最终得到的排版内容与电子书原始内容不一致。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的基于电子书的排版处理方法、电子
【技术保护点】
1.一种基于电子书的排版处理方法,包括:/n获取针对电子书的原始页面内容进行解析后得到的页面元素,识别所述页面元素中包含的多个路径类元素;/n根据所述多个路径类元素在所述原始页面内容中的位置信息,对所述多个路径类元素进行分组处理,得到元素分组集合;/n根据所述元素分组集合确定所述原始页面内容中包含的图片区域,针对所述图片区域执行截图处理,得到与所述图片区域相对应的截图图片;/n根据所述截图图片生成与所述原始页面内容相对应的页面排版内容。/n
【技术特征摘要】
1.一种基于电子书的排版处理方法,包括:
获取针对电子书的原始页面内容进行解析后得到的页面元素,识别所述页面元素中包含的多个路径类元素;
根据所述多个路径类元素在所述原始页面内容中的位置信息,对所述多个路径类元素进行分组处理,得到元素分组集合;
根据所述元素分组集合确定所述原始页面内容中包含的图片区域,针对所述图片区域执行截图处理,得到与所述图片区域相对应的截图图片;
根据所述截图图片生成与所述原始页面内容相对应的页面排版内容。
2.根据权利要求1所述的方法,其中,所述根据所述多个路径类元素在所述原始页面内容中的位置信息,对所述多个路径类元素进行分组处理,得到元素分组集合包括:
根据所述位置信息,判断是否存在相互交叠的至少两个路径类元素;
若是,将所述存在相互交叠的至少两个路径类元素划分为一个元素分组集合;其中,所述相互交叠包括:直接交叠和/或间接交叠。
3.根据权利要求1或2所述的方法,其中,所述根据所述多个路径类元素在所述原始页面内容中的位置信息,对所述多个路径类元素进行分组处理,得到元素分组集合包括:
根据所述位置信息,将位置间隔小于预设间隔阈值的至少两个路径类元素划分为一个元素分组集合。
4.根据权利要求1-3任一所述的方法,其中,所述根据所述元素分组集合确定所述原始页面内容中包含的图片区域包括:
将与所述元素分组集合中的各个路径类元素的位置相匹配的区域确定为候选区域;
识别所述候选区域中不属于图片主体的页面元素,根据识别结果确定所述图片区域。
5.根据权利要求4所述的方法,其中,所述识别所述候选区域中不属于图片主体的页面元素,根据识别结果确定所述图片区域包括:
根据所述候选区域中包含的各个页面元素在所述原始页面内容中的编辑次序,识别所述候选区域中不属于图片主体的页面元素;
...
【专利技术属性】
技术研发人员:张恒,
申请(专利权)人:掌阅科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。