一种PDF文档生成、编辑的方法和系统技术方案

技术编号:7038758 阅读:244 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种PDF文档,包括以图像模型为基础,使用抽象语法来描述的PDF的版式流层,在所述的版式流层上设置包含文件内容逻辑信息的高层抽象内容层,在所述的版式流层下设置符合PDF语法规范的PDF对象层,在所述的PDF对象层下设置文件二进制流层。本发明专利技术还公开了生成以及编辑PDF文档的方法和系统。本发明专利技术公开的PDF文档,生成以及编辑PDF文档的方法和系统使得PDF文件变得可编辑,实现与doc文件相似的编辑性,可对PDF文档中段落内容、格式、图片等等进行编辑。

【技术实现步骤摘要】

本专利技术涉及PDF (PortabIe Document Format)文件处理领域,更具体地说,涉及一种PDF文档生成、编辑的方法和系统
技术介绍
众所周知,PDF全称Portable Document format,译为可移植文档格式,是一种电子文件格式。这种文件格式与操作系统平台无关,也就是说,PDF文件不管是在Windows, Unix还是在苹果公司的Mac OS操作系统中都是通用的。这一性能使它成为在hternet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。PDF文件以Postkript语言图像模型为基础,使用抽象语法来描述文件。PDF文件中包含了许多抽象对象,如文字(text)、图形(graphic)、图像(image)等,这些对象共同描述了整个页面。通过这些对象,整个页面的显示信息完全固定,如页面布局、格式等。这实现了 PDF的独立性,即在任意平台上都以相同的方式显示。PDF文件与.doc、. html等可编辑文件最大区别在于前者属于版式流(Display Stream),后者属于内容流(Content Stream)。在doc文件中只包含了内容而没有布局等显示信息。如何在屏幕上显示doc文件由客户程序(Consumer Application),如MS Word根据上下文信息、文件内容、段落格式实时计算。所以,对于同一份文件不同的客户程序的显示可能不同,如MS Word和Open Office 显示不一定完全一样。所以内容流文件无法保证可移植性。但由于文件只包含内容,所以要对内容编辑、修改就十分方便,至于修改后的内容如何显示,客户程序会重新布局。而在PDF文件中则包含了完全的显示信息,如每一页的布局,每一个字在页面的显示坐标,用什么字体显示,以什么样的字形显示,字体大小如何等。每一张页面都包含了完全的显示信息,所以不管在任意平台上,PDF文件都是以相同的方式显示,不会有所差别。这种方法保证了 PDF文件的可移植性,但也使其失去了可编辑性。比如删除了 PDF 文件中文本的某一部分,则在其之后的文本的显示坐标都要重新修改。目前的一些PDF编辑软件,其所编辑的只是PDF本身的对象,如添加文本,图片, 字体等等。这些编辑的对象是不包含结构信息的,不属于文本编辑的范畴,无法做到如MS Word般的编辑,如删除、更改段落、填充表格等。
技术实现思路
本专利技术要解决的技术问题在于,提供一种可编辑的PDF文档生成、及编辑的方法和系统。本专利技术公开了一种PDF文档,包括以图像模型为基础,使用抽象语法来描述的PDF 的版式流层,在所述的版式流层上设置包含文件内容逻辑信息的高层抽象内容层,在所述的版式流层下设置包含PDF语法对象的PDF对象层,在所述的PDF对象层下设置文件二进制流层。在本专利技术所述的PDF文档中,所述文件内容逻辑信息包括段落、表格、图形、图像及在段落、表格、图形、图像中定义多种格式、属性。在本专利技术所述的PDF文档中,所述的高层抽象内容层为可编辑内容逻辑层,当需要对PDF编辑时,修改高层抽象内容层,然后经版式流层及PDF对象层将修改传递到文件二进制流层,生成新的PDF文件替换原PDF文档。本专利技术公开了一种生成PDF文档的方法,用于生成权利要求1所述的PDF文档,包括Al.设置包含文件内容逻辑信息的高层抽象内容层;A2.在高层抽象内容层构建高层对象;A3.在版式流层下设置包含PDF语法对象的PDF对象层;A4.将所述的高层对象经所述的版式流层转换到PDF对象层,获得PDF对象;A5.在所述的PDF对象层下设置文件二进制流层;A6.按照PDF语法规范将所述的PDF对象写入文件二进制流层。在本专利技术所述的生成PDF文档的方法中,所述步骤A2中构建高层对象时,在高层抽象内容层向版式流层中添加段落、表格、图形、图像,并定义各种属性、格式。在本专利技术所述的生成PDF文档的方法中,所述的PDF对象包括PDF文本对象、PDF 图形对象等。在本专利技术所述的生成PDF文档的方法中,步骤A2之后还包括步骤A21,保存所述的高层对象。本专利技术公开了一种生成PDF文档的系统,用于实现上述技术方案中所述的生成 PDF的方法,包括设置高层抽象内容层单元,用于设置包含文件内容逻辑信息的高层抽象内容层;构建高层对象单元,与所述的设置高层抽象内容层抽象内容层单元相连,用于在高层抽象内容层构建高层对象;设置PDF对象层单元,与所述的构建高层对象单元相连,用于在版式流层下设置符合PDF语法规范的PDF对象层;获得PDF对象单元,与所述的设置PDF对象层单元相连,用于将所述的高层对象经所述的版式流层转换到PDF对象层,获得PDF对象;设置文件二进制流层单元,与所述的获得PDF对象单元相连,用于在所述的PDF对象层下设置文件二进制流层;写入PDF对象单元,与所述的设置文件二进制流层单元相连,用于按照PDF语法规范将所述的PDF对象写入文件二进制流层。在本专利技术所述的生成PDF文档的系统中,所述的构建高层对象单元包括段落子单元、表格子单元、图形子单元、图像子单元。在本专利技术所述的生成PDF文档的系统中,所述的PDF对象层包括PDF文本对象子单元、PDF图形对象子单元等。在本专利技术所述的生成PDF文档的系统中,所述的生成PDF文档的系统为营业厅用户流程系统。本专利技术公开了一种编辑PDF文档的方法,用于编辑上述技术方案中所述的PDF文档,包括Bi.读取抽象内容层信息构建高层对象;B2.对所述的高层对象进行修改;B3.将高层对象的变化传递到文件二进制流层;B4.生成修改的PDF文件以替换原PDF文档。在本专利技术所述的编辑PDF文档的方法中,步骤B2以及步骤B3之间还包括步骤 B21,保存所述的高层对象。在本专利技术所述的编辑PDF文档的方法中,所述步骤B2包括从保存的高层对象信息中还原原文件的高层对象,对其进行添加、修改、删除、编辑。本专利技术公开了一种编辑PDF文档的系统,用于实现上述的编辑PDF文档的方法,包括读取高层对象单元,用于读取抽象内容层信息构建高层对象;修改高层对象单元,与所述的读取高层对象单元相连,用于对所述的高层对象进行修改;传递高层对象单元,与所述的修改高层对象单元相连,用于将高层对象的变化传递到文件二进制流层;生成修改的PDF文件单元,与所述的传递高层对象单元相连,用于生成修改的PDF 文件以替换原PDF文档。在本专利技术所述的编辑PDF文档的系统中,还包括保存高层对象单元,用于保存所述的高层对象。在本专利技术所述的编辑PDF文档的系统中,所述的编辑PDF文档的系统为营业厅营业员流程系统。实施本专利技术的PDF文档,生成及编辑PDF文档的方法和系统,具有以下有益的技术效果通过添加高层抽象对象层,间接实现了 PDF文件的可编辑性,使得PDF文件可修改;通过添加间接层增强了 PDF文件的灵活性。在生成上也更便利、容易理解。 附图说明图1是本专利技术一种PDF文档结构方框图;图2为本专利技术实施例一种生成PDF文档方法工作流程图;图3为本专利技术实施例一种生成PDF文档系统结构方框图;图4为本专利技术实施例一种编辑PDF文档方法工作流程图;图5为本专利技术实施例一种编辑PDF文档系统结构方框图本文档来自技高网
...

【技术保护点】
1.一种PDF文档,包括以图像模型为基础,使用抽象语法来描述的PDF的版式流层,其特征在于,在所述的版式流层上设置包含文件内容逻辑信息的高层抽象内容层,在所述的版式流层下设置符合PDF语法规范的PDF对象层,在所述的PDF对象层下设置文件二进制流层。

【技术特征摘要】

【专利技术属性】
技术研发人员:侯云黄超
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1