一种文档格式的转换方法及装置制造方法及图纸

技术编号：4027210 阅读：165 留言：0更新日期：2012-04-11 18:40

本发明专利技术属于文档应用领域，公开了一种文档格式的转换方法及装置，所述方法包括：获取原文档中的文本信息和图形信息；将获取的原文档中的文本信息和图形信息进行文本特效识别，识别所述文本信息与所述图形信息之间的对应关系；将识别出的所述文本信息与所述图形信息之间的对应关系进行存储；根据所述存储的文本信息与所述图形信息之间的对应关系生成用户指定的文档格式。本发明专利技术使得诸如ＰＤＦ文档等原文档在转换为其他格式的文档时，能够保持原文档内容的还原度，增加文档转换后可编辑性，解决了转换后页面混乱的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于文档应用领域，具体涉及一种文档格式的转换方法及装置。
技术介绍
随着电脑的不断普及，无纸化办公得到越来越多的应用，各种各样的文档也大量的出现在用户的面前。以可移植文档格式(Portable Document Format，PDF)、office文档为例，在将PDF 格式的文档转换为office格式的文档时，面临较多的困难。在PDF格式的文档中，实际看到的文字特效，譬如例如下划线、删除线、字符底纹等，都是将图形与文本叠加形成的。因此，在将PDF文件转换为office格式的文档时，如果仅仅是从PDF文档中提取原始数据内容，有文字特效的文本就会变成分散的文本与图形混合在一起，如果需要还原文本特效，需要手动删除多余的图形并重新设置文本特效。上述的转换方式不但丢失了原有PDF的文本效果，在转换后，还会造成页面的混乱，给转换后的文档的编辑带来极大的不便。如何使得诸如PDF文档在转换为其他格式的文档时，能够保持原文档内容的还原度，增加文档转换后可编辑性，是文档转换
研究的方向之一。
技术实现思路
本专利技术的目的在于提供一种文档格式的转换方法，旨在使得诸如PDF文档在转换为其他格式的文档时，能够保持原文档内容的还原度，增加文档转换后可编辑性。本专利技术实施例是这样实现的，一种文档格式的转换方法，所述方法包括以下步骤获取原文档中的文本信息和图形信息；将获取的原文档中的文本信息和图形信息进行文本特效识别，识别所述文本信息与所述图形信息之间的对应关系；将识别出的所述文本信息与所述图形信息之间的对应关系进行存储；根据所述存储的文本信息与所述...

【技术保护点】
一种文档格式的转换方法，其特征在于，所述方法包括以下步骤：获取原文档中的文本信息和图形信息；将获取的原文档中的文本信息和图形信息进行文本特效识别，识别所述文本信息与所述图形信息之间的对应关系；将识别出的所述文本信息与所述图形信息之间的对应关系进行存储；根据所述存储的文本信息与所述图形信息之间的对应关系生成用户指定的文档格式。

【技术特征摘要】

【专利技术属性】
技术研发人员：李譞，晏检平，
申请(专利权)人：深圳市万兴软件有限公司，
类型：发明
国别省市：94[中国|深圳]

全部详细技术资料下载我是这个专利的主人