XPS结构化数据的解析方法技术

技术编号：12809371 阅读：161 留言：0更新日期：2016-02-05 08:33

本发明专利技术涉及一种XPS结构化数据的解析方法，包括步骤：初始化XPS文件；识别XPS文件中所需的字段数据；提取所述字段数据及其原始坐标；按照预定算法对所述原始坐标进行计算，得到准确的相对坐标；对所述相对坐标进行排序，先排序Y坐标，后排序X坐标；将排序后的文档或链表输出到指定路径。本发明专利技术不仅可以提高识别的准确度，而且简化了XPS文档中字段数据的提取难度，解决了XPS文档中原始坐标混乱的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电子文档处理
，特别涉及一种XPS结构化数据的解析方法。
技术介绍
XPS (XML Paper Specificat1n，XML文件规格书)是一种电子文件格式，它是微软公司开发的一种文档保存与查看的规范。XPS可以维护文档的一致外观(不管环境变量如何)，实现所见即所得，也支持安全功能(例如，数字签名)，因此，被越来越广泛地使用在各个领域。但是，XPS文档类似于PDF文档，是一种只读文档格式，其采用结构化数据形式保存数据，在使用计算机读取文档内容时，需要进行相应的解析和提取处理。
技术实现思路
本专利技术旨在提供一种XPS结构化数据的解析方法，以实现对XPS文档内容进行自动识别和提取功能。为达到上述目的，本专利技术采用如下技术方案。本专利技术提供一种XPS结构化数据的解析方法，包括步骤: 初始化XPS文件；识别XPS文件中所需的字段数据；提取所述字段数据及其原始坐标；按照预定算法对所述原始坐标进行计算，得到准确的相对坐标；对所述相对坐标进彳丁排序，先排序Y坐标，后排序X坐标；将排序后的文档或链表输出到指定路径。上...

【技术保护点】
一种XPS结构化数据的解析方法，包括步骤：初始化XPS文件；识别XPS文件中所需的字段数据；提取所述字段数据及其原始坐标；按照预定算法对所述原始坐标进行计算，得到准确的相对坐标；对所述相对坐标进行排序，先排序Y坐标，后排序X坐标；将排序后的文档或链表输出到指定路径。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘春波，黎涛，
申请(专利权)人：深圳市依伴数字科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人