【技术实现步骤摘要】
本专利技术涉及电子文档处理
,特别涉及一种XPS结构化数据的解析方法。
技术介绍
XPS (XML Paper Specificat1n,XML文件规格书)是一种电子文件格式,它是微软公司开发的一种文档保存与查看的规范。XPS可以维护文档的一致外观(不管环境变量如何),实现所见即所得,也支持安全功能(例如,数字签名),因此,被越来越广泛地使用在各个领域。但是,XPS文档类似于PDF文档,是一种只读文档格式,其采用结构化数据形式保存数据,在使用计算机读取文档内容时,需要进行相应的解析和提取处理。
技术实现思路
本专利技术旨在提供一种XPS结构化数据的解析方法,以实现对XPS文档内容进行自动识别和提取功能。为达到上述目的,本专利技术采用如下技术方案。本专利技术提供一种XPS结构化数据的解析方法,包括步骤: 初始化XPS文件; 识别XPS文件中所需的字段数据; 提取所述字段数据及其原始坐标; 按照预定算法对所述原始坐标进行计算,得到准确的相对坐标; 对所述相对坐标进彳丁排序,先排序Y坐标,后排序X坐标; 将排序后的文档或链表输出到指定路径。上 ...
【技术保护点】
一种XPS结构化数据的解析方法,包括步骤:初始化XPS文件;识别XPS文件中所需的字段数据;提取所述字段数据及其原始坐标;按照预定算法对所述原始坐标进行计算,得到准确的相对坐标;对所述相对坐标进行排序,先排序Y坐标,后排序X坐标;将排序后的文档或链表输出到指定路径。
【技术特征摘要】
【专利技术属性】
技术研发人员:刘春波,黎涛,
申请(专利权)人:深圳市依伴数字科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。