文档转换方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:28037130 阅读:20 留言:0更新日期:2021-04-09 23:19
本发明专利技术涉及文档转换方法、装置、计算机设备及存储介质,该方法包括获取待转换文档;判断待转换文档内的文本字体是否是符合预设要求;若待转换文档内的文本字体符合预设要求,则对符合预设要求的文本字体进行合成,以得到中间字体;根据中间字体对待转换文档进行文档转换,以得到转换结果。本发明专利技术通过对待转换文档进行解析并判断是否出现会导致显示文本出现乱码的字体类型,对这些字体类型对应的文本字体进行TrueType字体的合成,利用合成后的TrueType字体替换转换后出现乱码的显示文本,以得到转换结果,实现文档转换后不会出现乱码的问题。

【技术实现步骤摘要】
文档转换方法、装置、计算机设备及存储介质
本专利技术涉及文档处理方法,更具体地说是指文档转换方法、装置、计算机设备及存储介质。
技术介绍
PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中,该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。在将PDF文件格式的文档转换为其他格式的文档时,当文档中文本使用的字体为Type3,而且其ToUnicode编码表如果不正确,会导致转换后得到目标格式文档文本显示乱码。因此,有必要设计一种新的方法,实现文档转换后不会出现乱码的问题。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供文档转换方法、装置、计算机设备及存储介质。为实现上述目的,本专利技术采用以下技术方案:文档转换方法,包括:获取待转换文档;判断所述待转换文档内的文本字体是否是符合预设要求;若所述待转换文档内的文本字体符合预设要求,则对符合预设要求的所述文本字体进行合成,以得到中间字体;根据所述中间字体对所述待转换文档进行文档转换,以得到转换结果。其进一步技术方案为:所述判断所述待转换文档内的文本字体是否是符合预设要求,包括:对所述待转换文档进行解析,以得到所述文本字体的类型;判断所述文本字体的类型是否包含预设的字体类型;若所述文本字体的类型包含预设的字体类型,则所述待转换文档内的文本字体符合预设要求;若所述文本字体的类型不包含预设的字体类型,则所述待转换文档内的文本字体不符合预设要求。其进一步技术方案为:所述判断所述待转换文档内的文本字体是否是符合预设要求之后,还包括:若所述转换文档内的文本字体不符合预设要求,则对所述待转换文档进行文档转换,以得到转换结果。其进一步技术方案为:所述对符合预设要求的所述文本字体进行合成,以得到中间字体,包括:将符合预设要求的所述文本字体合成为TrueType字体,以得到中间字体。其进一步技术方案为:所述将符合预设要求的所述文本字体合成为TrueType字体,以得到中间字体,包括:获取符合预设要求的所述文本字体的字符路径信息以及编码信息;根据所述字符路径信息生成字符轮廓信息;根据所述字符轮廓信息以及所述编码信息合成TrueType字体,以得到中间字体。其进一步技术方案为:所述根据所述字符轮廓信息以及所述编码信息合成TrueType字体,以得到中间字体,包括:根据所述编码信息合成TrueType字体的cmap表;根据所述字符轮廓信息合成TrueType字体的glyph表;根据所述cmap表以及所述glyph表合成TrueType字体对应的表结构,以得到中间字体。其进一步技术方案为:所述根据所述中间字体对所述待转换文档进行文档转换,以得到转换结果,包括:将所述待转换文档转换为指定格式的文档,以得到初步结果;将所述中间字体替换所述初步结果内所述字符路径信息对应的显示文本,以得到转换结果。本专利技术还提供了文档转换装置,包括:文档获取单元,用于获取待转换文档;判断单元,用于判断所述待转换文档内的文本字体是否是符合预设要求;合成单元,用于若所述待转换文档内的文本字体符合预设要求,则对符合预设要求的所述文本字体进行合成,以得到中间字体;第一转换单元,用于根据所述中间字体对所述待转换文档进行文档转换,以得到转换结果。本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。本专利技术与现有技术相比的有益效果是:本专利技术通过对待转换文档进行解析并判断是否出现会导致显示文本出现乱码的字体类型,对这些字体类型对应的文本字体进行TrueType字体的合成,利用合成后的TrueType字体替换转换后出现乱码的显示文本,以得到转换结果,实现文档转换后不会出现乱码的问题。下面结合附图和具体实施例对本专利技术作进一步描述。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的文档转换方法的应用场景示意图;图2为本专利技术实施例提供的文档转换方法的流程示意图;图3为本专利技术实施例提供的文档转换方法的子流程示意图;图4为本专利技术实施例提供的文档转换方法的子流程示意图;图5为本专利技术实施例提供的文档转换方法的子流程示意图;图6为本专利技术实施例提供的文档转换方法的子流程示意图;图7为本专利技术实施例提供的文档字体合成装置的示意性框图;图8为本专利技术实施例提供的文档字体合成装置的判断单元的示意性框图;图9为本专利技术实施例提供的文档字体合成装置的合成单元的示意性框图;图10为本专利技术实施例提供的文档字体合成装置的中间字体获取子单元的示意性框图;图11为本专利技术实施例提供的文档字体合成装置的第一转换单元的示意性框图;图12为本专利技术实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1和图2,图1为本专利技术实施例提供的文档转换方法的应用场景示意图。图2为本专利技术实施例提供的文档转换方法的示意性流程图。该文档转换方法应用于服务器中。该服务器与终端进行数据交互,从终端获取到待转换文档,当待转换文档内的文本字体没有设定的字体类型,比如Type3类型等转换后出现乱码的字体类型时,需要对这些文本字体进行合成后再对待转换文档进行转换,可实现转换后的本文档来自技高网...

【技术保护点】
1.文档转换方法,其特征在于,包括:/n获取待转换文档;/n判断所述待转换文档内的文本字体是否是符合预设要求;/n若所述待转换文档内的文本字体符合预设要求,则对符合预设要求的所述文本字体进行合成,以得到中间字体;/n根据所述中间字体对所述待转换文档进行文档转换,以得到转换结果。/n

【技术特征摘要】
1.文档转换方法,其特征在于,包括:
获取待转换文档;
判断所述待转换文档内的文本字体是否是符合预设要求;
若所述待转换文档内的文本字体符合预设要求,则对符合预设要求的所述文本字体进行合成,以得到中间字体;
根据所述中间字体对所述待转换文档进行文档转换,以得到转换结果。


2.根据权利要求1所述的文档转换方法,其特征在于,所述判断所述待转换文档内的文本字体是否是符合预设要求,包括:
对所述待转换文档进行解析,以得到所述文本字体的类型;
判断所述文本字体的类型是否包含预设的字体类型;
若所述文本字体的类型包含预设的字体类型,则所述待转换文档内的文本字体符合预设要求;
若所述文本字体的类型不包含预设的字体类型,则所述待转换文档内的文本字体不符合预设要求。


3.根据权利要求1所述的文档转换方法,其特征在于,所述判断所述待转换文档内的文本字体是否是符合预设要求之后,还包括:
若所述转换文档内的文本字体不符合预设要求,则对所述待转换文档进行文档转换,以得到转换结果。


4.根据权利要求1所述的文档转换方法,其特征在于,所述对符合预设要求的所述文本字体进行合成,以得到中间字体,包括:
将符合预设要求的所述文本字体合成为TrueType字体,以得到中间字体。


5.根据权利要求4所述的文档转换方法,其特征在于,所述将符合预设要求的所述文本字体合成为TrueType字体,以得到中间字体,包括:
获取符合预设要求的所述文本字体的字符路径信息以及编码信息;
根据所述字符路径信息生成字符轮廓信息;
根据所述字符轮廓信...

【专利技术属性】
技术研发人员:黄安兴
申请(专利权)人:万兴科技湖南有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1