一种图纸无线表格的结构化数据识别方法、装置和介质制造方法及图纸

技术编号:40333863 阅读:28 留言:0更新日期:2024-02-09 14:24
本申请涉及表格识别领域,尤其是涉及一种图纸无线表格的结构化数据识别方法、装置和介质,对图纸进行图框和图层检测,得到图框形状;对所述图框形状进行检测,得到子图框形状;从所述图框形状中拆出所述子图框形状包含的图像,得到待识别图像;将待识别图像输入位置特征提取层,得到行分割特征和列分割特征;将待识别图像输入注意力机制块,得到文本序列关系;将所述行分割特征、列分割特征和文本序列关系输入回归器,得到所述待识别图像包含的表格的结构化数据,提高了对不同专业的建筑图纸中的无线表格数据结构化识别的准确度。

【技术实现步骤摘要】

本申请涉及表格识别领域,尤其是涉及一种图纸无线表格的结构化数据识别方法、装置和介质


技术介绍

1、建筑图纸表格数据形式多样,涉及各专业领域。目前无线表格识别技术识别空白、跨多个行列、多行文本的单元格的准确率不高。主流的无线表格的行列分割方式是基于深度学习的语义分割或实例分割,或者只用基于文本检测的统计学习来分割,这样分割会有误差。而且,目前无线表格的单元格识别对标注数据太依赖,不考虑图纸单元格内容的语义,不能实现多模态的表格文本识别。

2、因此,如何提高在不同专业的建筑图纸中,无线表格数据结构化识别的准确度,是亟需解决的问题。


技术实现思路

1、本申请提供了一种图纸无线表格的结构化数据识别方法、装置和介质,能够提高对不同专业的建筑图纸中的无线表格数据结构化识别的准确度。

2、为了实现上述目的,本专利技术采用了如下技术方案:

3、第一方面,本专利技术提供一种图纸无线表格的结构化数据识别方法,所述方法包括:

4、对图纸进行图框和图层检测,得到图框形状;

...

【技术保护点】

1.一种图纸无线表格的结构化数据识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的图纸无线表格的结构化数据识别方法,其特征在于,还包括:

3.根据权利要求1所述的图纸无线表格的结构化数据识别方法,其特征在于,所述位置特征提取层包括编码器和解码器,所述将待识别图像输入位置特征提取层,得到行分割特征、列分割特征,包括:

4.根据权利要求1所述的图纸无线表格的结构化数据识别方法,其特征在于,所述注意力机制块包括多头注意力机制块和正则规划层,所述将待识别图像输入注意力机制块,得到文本序列关系,包括:

5.根据权利要求1所述的图纸无线表格...

【技术特征摘要】

1.一种图纸无线表格的结构化数据识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的图纸无线表格的结构化数据识别方法,其特征在于,还包括:

3.根据权利要求1所述的图纸无线表格的结构化数据识别方法,其特征在于,所述位置特征提取层包括编码器和解码器,所述将待识别图像输入位置特征提取层,得到行分割特征、列分割特征,包括:

4.根据权利要求1所述的图纸无线表格的结构化数据识别方法,其特征在于,所述注意力机制块包括多头注意力机制块和正则规划层,所述将待识别图像输入注意力机制块,得到文本序列关系,包括:

5.根据权利要求1所述的图纸无线表格的结构化数据识别方法,其特征在于,包括:

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名
申请(专利权)人:上海帮图信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1