XPS结构化数据的解析方法技术

技术编号:12809371 阅读:161 留言:0更新日期:2016-02-05 08:33
本发明专利技术涉及一种XPS结构化数据的解析方法,包括步骤:初始化XPS文件;识别XPS文件中所需的字段数据;提取所述字段数据及其原始坐标;按照预定算法对所述原始坐标进行计算,得到准确的相对坐标;对所述相对坐标进行排序,先排序Y坐标,后排序X坐标;将排序后的文档或链表输出到指定路径。本发明专利技术不仅可以提高识别的准确度,而且简化了XPS文档中字段数据的提取难度,解决了XPS文档中原始坐标混乱的问题。

【技术实现步骤摘要】

本专利技术涉及电子文档处理
,特别涉及一种XPS结构化数据的解析方法
技术介绍
XPS (XML Paper Specificat1n,XML文件规格书)是一种电子文件格式,它是微软公司开发的一种文档保存与查看的规范。XPS可以维护文档的一致外观(不管环境变量如何),实现所见即所得,也支持安全功能(例如,数字签名),因此,被越来越广泛地使用在各个领域。但是,XPS文档类似于PDF文档,是一种只读文档格式,其采用结构化数据形式保存数据,在使用计算机读取文档内容时,需要进行相应的解析和提取处理。
技术实现思路
本专利技术旨在提供一种XPS结构化数据的解析方法,以实现对XPS文档内容进行自动识别和提取功能。为达到上述目的,本专利技术采用如下技术方案。本专利技术提供一种XPS结构化数据的解析方法,包括步骤: 初始化XPS文件; 识别XPS文件中所需的字段数据; 提取所述字段数据及其原始坐标; 按照预定算法对所述原始坐标进行计算,得到准确的相对坐标; 对所述相对坐标进彳丁排序,先排序Y坐标,后排序X坐标; 将排序后的文档或链表输出到指定路径。上述解析方法中,所述识本文档来自技高网...

【技术保护点】
一种XPS结构化数据的解析方法,包括步骤:初始化XPS文件;识别XPS文件中所需的字段数据;提取所述字段数据及其原始坐标;按照预定算法对所述原始坐标进行计算,得到准确的相对坐标;对所述相对坐标进行排序,先排序Y坐标,后排序X坐标;将排序后的文档或链表输出到指定路径。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘春波黎涛
申请(专利权)人:深圳市依伴数字科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1