【技术实现步骤摘要】
文档转换方法、装置、电子设备及计算机存储介质
[0001]本专利技术实施例涉及数据处理领域,尤其涉及一种文档转换方法、装置、电子设备及计算机存储介质。
技术介绍
[0002]随着无纸化办公应用广泛,版式文档合同生成、文档生成的需求空前扩大。DOCX是一种文档格式,其编辑方便的特性使得该文档格式成为目前应用最广泛、工作中最常使用的文档格式。PDF是可携带文档格式,可由DOCX文档转换而来,PDF文档忠实于原稿的每一个字符、颜色以及图像,在任意打印机上都可保证精确的颜色和准确的打印效果,因此是最常用于电子文档、打印文档的文档格式。
[0003]现有技术中,DOCX文档生成PDF文档的方法,在执行过程中需要人工对文件的排版和布局等进行调整,效率低下。
技术实现思路
[0004]有鉴于此,本专利技术实施例提供一种文档转换方法、装置、电子设备及计算机存储介质,以至少解决上述问题。
[0005]根据本专利技术实施例的第一方面,提供了一种文档转换方法,该文档转换方法包括获取第一格式文档的数据标签与目标文字数 ...
【技术保护点】
【技术特征摘要】
1.一种文档转换方法,其特征在于,包括:获取第一格式文档的数据标签与目标文字数据的对应关系、以及第一数据模型中与所述数据标签对应的流式标签,所述第一格式为可编辑格式,所述第一数据模型用于输出可编辑格式的文档;基于所述数据标签、所述目标文字数据和所述流式标签之间的对应关系,将所述目标文字数据写入所述第一数据模型;将所述第一数据模型转换为第二数据模型,所述第二数据模型用于输出不可编辑格式的文档;通过所述第二数据模型,输出对应于所述第一格式文档的第二格式文档,所述第二格式为不可编辑格式。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述第一格式文档,构建所述第一数据模型的文档树,所述文档树用于描述所述第一格式文档的目录结构。3.根据权利要求2所述的方法,其特征在于,获取第一格式文档的数据标签与目标文字数据的对应关系、以及第一数据模型中与所述数据标签对应的流式标签,包括:获取所述第一格式文档的哈希表,所述哈希表指示第一格式文档的数据标签与目标文字数据的对应关系;根据所述哈希表和所述第一格式文档中的数据标签,确定所述第一数据模型中与所述数据标签对应的流式标签。4.根据权利要求3所述的方法,其特征在于,根据所述哈希表和所述第一格式文档中的数据标签,确定所述第一数据模型中与所述数据标签对应的流式标签,包括:遍历所述第一数据模型的文档树,根据所述哈希表查找所述第一数据模型中与所述第一格式文档中的数据标签的数据格式一致的流式数据;对所述流式数据进行标记,得到所述流式标签。5.根据权利要求4所述...
【专利技术属性】
技术研发人员:赵晋,卞芳,周勇,刘茜,赵伟,危学艳,王启刚,
申请(专利权)人:航天信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。