一种PDF文件转版式数据流文件的方法技术

技术编号:32576461 阅读:59 留言:0更新日期:2022-03-09 17:05
本发明专利技术公开了一种PDF文件转版式数据流文件的方法包括解析pdf版式文件;读取pdf的文件内容,解析获取pdf的页码,分配多个线程,并发处理解析pdf的内容;pdf的内容包括基本对象、对象属性以及其资源对象;对pdf的各类对象进行加工处理,并转换对象属性中的坐标、宽、高,并与版式数据流元素对象结合形成版式数据流文件对象,版式数据流元素对象包括基本对象、绘制参数、资源引用路径、资源对象;创建版式数据流文件底板;将版式数据流文件对象填充到版式数据流文件底板中,形成标准版式数据流文件。本发明专利技术叙述的方法实现了pdf文件向版式数据流文件原版原样的转换,具有转换方法简单,采用引用的方式进行调用,去除冗余元素,保证了文件的转换速度的优点。了文件的转换速度的优点。了文件的转换速度的优点。

【技术实现步骤摘要】
一种PDF文件转版式数据流文件的方法


[0001]本专利技术涉及计算机
,特别涉及一种PDF文件转版式数据流文件的方法。

技术介绍

[0002]PDF格式是国际上线性的最流行的文件传输格式之一,是由Adobe Systems 用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出来的文件格式,并于2008年开放成为国际标准。但是目前PDF技术也存在着一些问题,比如:技术门槛较高、编辑技术复杂、无法动态拆分合并等问题。
[0003]版式数据流文件是江苏中威科技软件系统有限公司旗下的一款文件软件,中威科技规范了一套标准文档格式体系,在用户界面下集成了版式文件阅读、文件与流数据的交互、表单手写签批三大应用;
[0004]文件主要基于文件底板自动再造、多级分层结构展示、带笔锋的手写引擎、多文件合并顺捷阅读、签批闭包可追溯,叠批等创新技术。
[0005]以实现:
[0006]1、版式软件的阅读体验
[0007]2、灵活性:又实现了数据的灵活交互,
[0008]3、多元化:规范化的签批方式,文件支本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种PDF文件转版式数据流文件的方法,其特征在于,包括:解析pdf版式文件;读取pdf的文件内容,解析获取pdf的页码,放置到一个队列中形成页码队列,分配多个线程,用于并发处理获取每一页的pdf的内容;pdf的内容包括基本对象、对象属性以及其资源对象;基本对象包括文本对象、路径对象、图像对象;路径对象包括直线、矩形、贝塞尔曲线、或其中多个的组合;对象属性包括坐标、宽、高、绘制参数、资源引用路径,资源引用路径为基本对象与资源对象之间的引用路径;资源对象附件、多媒体文件、字体;对PDF的基本对象、对象属性以及其资源对象进行加工处理,按照规则转换其坐标、宽、高,并与版式数据流元素对象结合形成版式数据流文件对象,版式数据流元素对象包括基本对象、绘制参数、资源引用路径、资源对象;根据页码队列创建一个版式数据流文件底板;将版式数据流文件对象填充到版式数据流文件底板中,形成标准版式数据流文件。2.根据权利要求1所述的一种PDF文件转版式数据流文件的方法,其中,pdf版式文件的总页码数与版式数据流文件的总页码数相同;pdf版式文件的一页对应一个线程;pdf版式文件的页面与版式数据流文件的页面一一对应。3.根据权利要求1所述的一种PDF文件转版式数据流文件的方法,其中,版式数据流文件对象划分为四个数组进行存储,四个数组分别为第一数组、第二数组、第三数组以及第四数组,第一数组用于存储页码和内容对象,内容对象包括基本对象,和基本对象对应的坐标、宽、高;第二数组用于存储绘制参数;第三数组用于存储资源对象;第四数组用于存储引用路径,引用路径中包括资源引用路径和绘制参数引用路径,绘制参数引用路径指基本对象与绘制参数之间的引用路径。4.根据权利要求3所述的一种PDF文件转版式数据流文件的方法,其中,将页码和内容对象作为key和value,以<key,value>键值对方式存储于第一数组中。5.根据权利要求3所述的一种PDF文件转版式数据流文件的方法,其中,将id和绘...

【专利技术属性】
技术研发人员:何冉冉何中顾志平蔡亚军严伟
申请(专利权)人:江苏中威科技软件系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1