格式转换的方法、装置、存储介质和电子设备制造方法及图纸

技术编号:32565128 阅读:19 留言:0更新日期:2022-03-09 16:50
本申请涉及一种格式转换的方法、装置、存储介质和电子设备,所述方法包括:获取目标文件的各个节点的节点信息;在根据节点信息确定各个节点中存在富文本节点的情况下,获取富文本节点中的各个第一节点的节点高度,以及目标文件的各个节点中除富文本节点外的其他各个第二节点的节点高度;以逐个节点遍历的方式累计各个第一节点的节点高度和各个第二节点的节点高度;在累计高度大于预设高度阈值的情况下,新增第一目标页面;将在累计高度大于预设高度阈值之后所累计的第一高度对应的第一目标节点填充至新增的第一目标页面;将第一目标页面的格式转换至目标格式。页面的格式转换至目标格式。页面的格式转换至目标格式。

【技术实现步骤摘要】
格式转换的方法、装置、存储介质和电子设备


[0001]本申请涉及文件格式转换的领域,具体地,涉及一种格式转换的方法、装置、存储介质和电子设备。

技术介绍

[0002]由于PDF(Portable Document Format,可携带文档格式)文件的稳定性良好,许多其他格式的文件(例如网页)需要转换为PDF文件格式。但是现有的文件转换插件,通常只能设定PDF文件的宽高,如果在页面末尾处的剩余高度大于用于自动截取页面的预设剩余高度,即使该高度减去该预设剩余高度的差值小于行高,该插件会默认还可以继续截取页面,所以就会导致可能截取到一部分的文字信息。
[0003]现有的解决方法中,虽然可以针对目标文件的页面高度进行分页,但如果出现页面层级嵌套,就可能导致分页出现问题,例如存在富文本的情况下,就可能会导致生成的PDF文件页面内容出现大面积空白。

技术实现思路

[0004]为了解决上述问题,本申请提供了一种格式转换的方法、装置、存储介质和电子设备。
[0005]第一方面,本申请提供一种格式转换的方法,所述方法包括:获取目标文件的各个节点的节点信息;在根据所述节点信息确定所述各个节点中存在富文本节点的情况下,获取所述富文本节点中的各个第一节点的节点高度,以及所述目标文件的各个节点中除所述富文本节点外的其他各个第二节点的节点高度;以逐个节点遍历的方式累计各个所述第一节点的节点高度和各个所述第二节点的节点高度;在累计高度大于预设高度阈值的情况下,新增第一目标页面;将在所述累计高度大于所述预设高度阈值之后所累计的第一高度对应的第一目标节点填充至新增的第一目标页面;将所述第一目标页面的格式转换至目标格式。
[0006]可选地,所述以逐个节点遍历的方式累计各个所述第一节点的节点高度和各个所述第二节点的节点高度,包括:当在执行最近一次累计后得到的累计高度大于所述预设高度阈值的情况下,将所述最近一次累计的节点高度作为所述第一目标页面的初始节点高度重新开始累计;或者,当在执行最近一次累计后得到的累计高度大于所述预设高度阈值的情况下,将所述最近一次累计的节点高度与预设的标准页面高度的和值作为所述第一目标页面当前的累计高度,并将所述预设高度阈值更新为最近一次更新后的预设高度阈值与所述标准页面高度的和值。
[0007]可选地,所述方法还包括:在所述累计高度小于或者等于所述预设高度阈值的情况下,将所述累计高度对应的第二目标节点填充至当前的第二目标页面;将所述第二目标页面的格式转换至目标格式。
[0008]可选地,所述方法还包括:在各个所述第一节点的节点高度和各个所述第二节点
的节点高度遍历完成之后,删除所述富文本节点。
[0009]第二方面,本申请提供一种格式转换的装置,所述装置包括:获取模块,用于获取目标文件的各个节点的节点信息,所述节点信息包括节点格式,以及,在根据所述节点信息确定所述各个节点中存在富文本节点的情况下,获取所述富文本节点中的各个节点的第一节点的节点高度,以及所述目标文件的各个节点中除所述富文本节点外的其他各个节点的第二节点的节点高度;累计模块,用于以逐个节点遍历的方式累计各个所述第一节点的节点高度和各个所述第二节点的节点高度;页面管理模块,用于在累计高度大于预设高度阈值的情况下,新增第一目标页面;填充模块,用于将所述累计高度大于所述预设高度阈值后所累计的第一累计高度对应的第一目标节点填充至新增的第一目标页面;转换模块,用于将所述第一目标页面的格式转换至目标格式。
[0010]可选地,所述累计模块,用于:当在执行最近一次累计后得到的累计高度大于所述预设高度阈值的情况下,将所述最近一次累计的节点高度作为所述第一目标页面的初始节点高度重新开始累计;或者,当在执行最近一次累计后得到的累计高度大于所述预设高度阈值的情况下,将所述最近一次累计的节点高度与预设的标准页面高度的和值作为所述第一目标页面当前的累计高度,并将所述预设高度阈值更新为最近一次更新后的预设高度阈值与所述标准页面高度的和值。
[0011]可选地,所述填充模块,还用于在所述累计高度小于或者等于所述预设高度阈值的情况下,将所述累计高度对应的第二目标节点填充至当前的第二目标页面;所述转换模块,还用于将所述第二目标页面的格式转换至目标格式。
[0012]可选地,所述装置还包括:删除模块,用于在各个所述第一节点的节点高度和各个所述第二节点的节点高度遍历完成之后,删除所述富文本节点。
[0013]第三方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述方法的步骤。
[0014]第四方面,本申请提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现上述方法的步骤。
[0015]通过上述技术方案,可以根据目标文件的节点信息对目标文件进行划分,识别目标文件中各个节点,并在存在富文本节点的情况下,通过对富文本节点内容的遍历,获取富文本节点中的各个节点,从而获取富文本节点中的各个节点的节点高度以及目标文件中其他各个节点的节点高度,并通过逐个节点遍历的方式对各个节点的节点高度进行累计,然后根据累计得到的累计高度确定是否进行分页,并在累计高度大于预设高度阈值的情况下进行分页。这样,不仅避免了目标文件转化为的PDF文件中可能出现的文字被截取一部分的情况,另外在存在页面层级嵌套的情况下,也可以提取出嵌套层级中的文本内容,从而能够避免在生成的PDF文件中出现大面积空白的情况出现。
[0016]本申请的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0017]附图是用来提供对本申请的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本申请,但并不构成对本申请的限制。在附图中:
[0018]图1是根据一示例性实施例示出的一种格式转换的方法的流程图;
[0019]图2是根据一示例性实施例示出的另一种格式转换的方法的流程图;
[0020]图3是根据一示例性实施例示出的一种格式转换的装置框图;
[0021]图4是根据一示例性实施例示出的另一种格式转换的装置框图;
[0022]图5是根据一示例性实施例示出的一种电子设备。
具体实施方式
[0023]以下结合附图对本申请的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本申请,并不用于限制本申请。
[0024]首先对本申请的应用场景进行说明,由于PDF文件的稳定性,许多其他格式的文件需要转换为PDF文件格式,但是目前文件转换插件只能设定生成PDF文件的宽高。以网页编译的场景为例,在即时编译保存国标表单信息时,一般在用户付费后,前端会根据表单内容自动生成国标PDF文件,供用户观看,但目前所用的格式转换插件(jspdf)只能设定生成的PDF文件的宽高,这样在截取页面生成PDF文件的过程中可能存在问题,例如,待转换文件的行高是30px,设定生成的P本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种格式转换的方法,其特征在于,所述方法包括:获取目标文件的各个节点的节点信息;在根据所述节点信息确定所述各个节点中存在富文本节点的情况下,获取所述富文本节点中的各个第一节点的节点高度,以及所述目标文件的各个节点中除所述富文本节点外的其他各个第二节点的节点高度;以逐个节点遍历的方式累计各个所述第一节点的节点高度和各个所述第二节点的节点高度;在累计高度大于预设高度阈值的情况下,新增第一目标页面;将在所述累计高度大于所述预设高度阈值之后所累计的第一高度对应的第一目标节点填充至新增的第一目标页面;将所述第一目标页面的格式转换至目标格式。2.根据权利要求1所述的方法,其特征在于,所述以逐个节点遍历的方式累计各个所述第一节点的节点高度和各个所述第二节点的节点高度,包括:当在执行最近一次累计后得到的累计高度大于所述预设高度阈值的情况下,将所述最近一次累计的节点高度作为所述第一目标页面的初始节点高度重新开始累计;或者,当在执行最近一次累计后得到的累计高度大于所述预设高度阈值的情况下,将所述最近一次累计的节点高度与预设的标准页面高度的和值作为所述第一目标页面当前的累计高度,并将所述预设高度阈值更新为最近一次更新后的预设高度阈值与所述标准页面高度的和值。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述累计高度小于或者等于所述预设高度阈值的情况下,将所述累计高度对应的第二目标节点填充至当前的第二目标页面;将所述第二目标页面的格式转换至目标格式。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:在各个所述第一节点的节点高度和各个所述第二节点的节点高度遍历完成之后,删除所述富文本节点。5.一种格式转换的装置,其特征在于,所述装置包括:获取模块,用于获取目标文件的各个节点的节点信息,所述节点信息包括节点格式,以及,在根据所述节点信息确定所述各个节点中存在富文本节点的情况下,获取所述富文本节点中的各个节点的第一...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:盐城金堤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1