一种文档格式转换的方法及装置制造方法及图纸

技术编号:8883143 阅读:135 留言:0更新日期:2013-07-04 02:01
本申请公开了一种文档格式转换的方法及装置,所述文档格式转换的方法用于将PostScript文件转换为PDF文件,所述方法包括:确定一PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息;基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;将所述PostScript格式的图形对象转换为PDF格式的图形对象。

【技术实现步骤摘要】

本申请涉及电子文档处理领域,尤其涉及一种文档格式转换的方法及装置
技术介绍
PDF格式文档目前已经成为诸多电子格式文档中,应用最广泛的一种。在印刷和打印领域,PDF格式文档更是居于统治地位,不管是前端排版还是后端输出,PDF都是页面内容描述文档的标准格式。另一方面,Adobe在PDF格式文档应用之前,定义的页面内容描述文档的标准格式是PostScript,尽管PostScript在页面独立和设备相关方面相对于TOF格式文档而言都有诸多不足,但是由于PostScript悠久的应用历史和丰富的外围支持,故而有数量众多的用户仍然在使用PostScript格式来进行印刷和打印。由于PostScript格式文档在进行处理时,会遇到一系列麻烦,故而在将PostScript格式文档递交给印前输出系统做光栅化处理前,需要先经过规范化处理。即将PostScript格式转换为PDF格式。在PostScript格式文件的规范化处理中,一个重要的目标是在转换的过程中尽量保存对象的原始描述类型。如PostScript中的文字对象在转换之后仍然是HF中的文字对象,PostScript中的图形对象在转换之后也仍然是F1DF中的图形对象,PostScript中的图像对象在转换之后也仍然是TOF中的图像对象等等,这样可以最大限度地保持页面描述的原始面貌和设备无关性,从而尽可能真实地再现前端用户的设计意图。对于文字对象来说,最理想的情况是在转换之后仍然是文字对象,并且描述文字呈现形状的轮廓数据和控制数据都得到完全的保持,没有一点损失。目前常用的对基于PostScript中的charpath指令得到的文字向量路径的转换方法,包括如下两种:(I)基于PostScript中的charpath指令获得文字的向量路径,用填充或者划线模式对其进行描述,像一般的向量路径那样进行图形绘制操作。也就是,直接将基于PostScript得到的文字向量路径转换为对应的HF向量路径。(2)基于PDF格式对象中提供的Tr (Text rendering mode,文字绘制模式)属性,将由charpath指令得到的PostScript格式的向量路径转换为对应的PDF格式文字对象。然而在实现本申请实施例中技术方案的过程中,本申请人发现现有技术至少存在如下缺点:(I)由于在现有技术一中采用的是直接将PostScript格式的文字的轮廓转换为对应的TOF向量路径的技术方案,故而存在着丢失了文字的控制信息的技术问题;(2)由于在现有技术一中采用的是直接将PostScript格式的文字的轮廓转换为对应的HF向量路径的技术方案,故而存在着转换不准确、可能存在重影的技术问题。(3)由于在现有技术二中采用的是基于PDF格式对象中提供的Tr属性,将由charpath指令得到的PostScript格式的向量路径转换为对应的PDF格式文字对象的技术方案,故而存在着对于非charpath指令获得的向量路径,存在丢失的技术问题。
技术实现思路
本专利技术提供一种文档格式转换的方法及装置,用以解决现有技术中,存在着文字控制信息丢失或普通向量路径丢失的技术问题。本专利技术通过本申请中的实施例,提供如下技术方案:一方面,本专利技术通过本申请中的一个实施例,提供如下技术方案:一种文档格式转换方法,所述方法用于将PostScript文件转换为PDF文件,所述方法包括:确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息;基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;将所述PostScript格式的图形对象转换为PDF格式的图形对象。进一步的,所述PostScript格式的文字对象相关的参数信息,具体包括:所述文字对象的字体信息、所述文字对象的字符编码、所述文字对象的位置坐标以及所述文字对象的变换矩阵。进一步的,所述确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,还包括:设置第一字体信息为预存字体信息;设置第一变换矩阵为预存变换矩阵;设置第一文字绘制模式为预存文字模式。进一步的,所述基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象,具体包括:将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息;将所述预存变换矩阵由第一变换矩阵变换为所述文字对象的变换矩阵;将所述文字绘制模式由第一文字绘制模式变换为所述文字对象的文字绘制模式;基于所述文字对象的字体信息、所述文字对象的变换矩阵以及所述文字对象的绘制模式,将所述PostScript格式的文字对象转换为PDF格式的文字对象。进一步的,所述文字对象的绘制模式,具体为:填充模式或划线模式。进一步的,所述将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息之前,还包括:保存所述第一字体信息;保存所述第一变换矩阵;保存所述第一文字绘制模式。进一步的,所述将所述PostScript格式的文字对象转换为PDF格式的文字对象之后,还包括:将所述预存字体信息恢复为所述第一字体信息;将所述预存变换矩阵恢复为所述第一变换矩阵;将所述预存文字绘制模式恢复为所述第一文字绘制模式。另一方面,本专利技术通过本申请中的另一实施例提供如下技术方案:一种文档格式转换装置,所述装置用于将PostScript文件转换为PDF文件,所述装置包括:确定单元:用于确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;记录单元:用于在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息;文字转换单元:用于基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;图形转换单元:用于将所述PostScript格式的图形对象转换为TOF格式的图形对象。进一步的,所述装置还包括:字体设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,设置第一字体信息为预存字体信息;矩阵设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前设置第一变换矩阵为预存变换矩阵;绘制设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,设置第一文字绘制模式为预存文字模式。进一步的,所述文字转换单元,具体包括:字体转换模块:用于将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息;矩阵转换模块:用于将所述预存变换矩阵由第一变换矩阵变换为所述文字对象的变换矩阵;绘制转换模块:用于将所述文字绘制模式由第一文字绘制模式变换为所述文字对象的文字绘制模式;转换模块:用于基于所述文字对象的字体信息、所述文字对象的变换矩阵以及所述文字对象的绘制模式,将所述PostScri本文档来自技高网
...

【技术保护点】
一种文档格式转换的方法,所述方法用于将PostScript文件转换为PDF文件,其特征在于,所述方法包括:确定一PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息;基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;将所述PostScript格式的图形对象转换为PDF格式的图形对象。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈恳
申请(专利权)人:北大方正集团有限公司北京北大方正电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1