一种版式文件表格的识别方法及装置制造方法及图纸

技术编号:44141540 阅读:19 留言:0更新日期:2025-01-29 10:18
本发明专利技术提供一种版式文件表格的识别方法及装置,涉及计算机信息处理领域。所述版式文件表格的识别方法包括:通过获取待识别版式文件中表格所对应的待处理路径线以及每个待处理路径线所对应的基本参数,所述基本参数包括:待处理路径线的裁剪区参数、边框参数、填充色参数;根据每个待处理路径线所对应的基本参数,对待处理路径线进行预处理,得到目标表格的目标路径线;根据目标路径线,确定目标表格所对应的初始目标区域;根据初始目标区域,确定目标表格的目标向量点;根据目标向量点和表格的制定规则,确定目标表格。本发明专利技术的方案实现了对版式文件内表格的精准识别,同时具有准确性高,成本低,使用场景广以及可以脱机使用的优点。

【技术实现步骤摘要】

本专利技术涉及计算机信息处理领域,具体涉及一种版式文件表格的识别方法及装置


技术介绍

1、版式电子公文技术凭借安全、准确、可靠、方便等特性,正逐渐的成为办公不可或缺的技术,而版式文档不同于流式文档,有明确的表格单元,版式文档就如同在黑板上画出来的一样,只不过是用矢量图画的,具有缩放不失真的特性,如何运用版式文档的这些路径线正确的识别表格十分重要,在医疗等领域表格具有相当大的占比;而现有的技术方案是根据版式文档的元数据来识别表格,而这种方法存在识别精度低的问题。


技术实现思路

1、本专利技术要解决的技术问题是提供一种版式文件表格的识别方法及装置,解决了现有版式文件表格的识别方法存在识别精度低的问题。

2、为解决上述技术问题,本专利技术的技术方案如下:

3、本专利技术的实施例提出一种版式文件表格的识别方法,包括:

4、获取待识别版式文件中表格所对应的待处理路径线以及每个所述待处理路径线所对应的基本参数,所述基本参数包括:待处理路径线的裁剪区参数、边框参数、填充色参数;

本文档来自技高网...

【技术保护点】

1.一种版式文件表格的识别方法,其特征在于,包括:

2.根据权利要求1所述的版式文件表格的识别方法,其特征在于,根据每个所述待处理路径线所对应的基本参数,对所述待处理路径线进行预处理,得到目标表格的目标路径线,包括:

3.根据权利要求2所述的版式文件表格的识别方法,其特征在于,对所述第一处理路径线中带有填充色的矩形路径线进行变线处理,得到第二处理路径线,包括:

4.根据权利要求2所述的版式文件表格的识别方法,其特征在于,对所述第二处理路径线进行分割处理,得到第四处理路径线,包括:

5.根据权利要求2所述的版式文件表格的识别方法,其特征在于,...

【技术特征摘要】

1.一种版式文件表格的识别方法,其特征在于,包括:

2.根据权利要求1所述的版式文件表格的识别方法,其特征在于,根据每个所述待处理路径线所对应的基本参数,对所述待处理路径线进行预处理,得到目标表格的目标路径线,包括:

3.根据权利要求2所述的版式文件表格的识别方法,其特征在于,对所述第一处理路径线中带有填充色的矩形路径线进行变线处理,得到第二处理路径线,包括:

4.根据权利要求2所述的版式文件表格的识别方法,其特征在于,对所述第二处理路径线进行分割处理,得到第四处理路径线,包括:

5.根据权利要求2所述的版式文件表格的识别方法,其特征在于,对所述第四处理路径线进行合...

【专利技术属性】
技术研发人员:马锦程
申请(专利权)人:北京数科网维技术有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1