一种识别铁路图纸中表格内容的方法技术

技术编号:21185262 阅读:48 留言:0更新日期:2019-05-22 15:53
本发明专利技术提供了一种识别铁路图纸中表格内容的方法,它包括以下步骤:步骤1,识别表格中的垂直直线和水平直线,并分别读取坐标信息;步骤2,根据所述坐标信息建立直角坐标系,确定含有最小横坐标和最小纵坐标的点为查找点;步骤3,查找交叉点,形成封闭单元格;步骤4,将每个查找到的交叉点作为新的查找点重复步骤3,直至形成整个表格;步骤5,读取表格中每段文字内容的坐标信息,并填入正确的封闭单元格;步骤6,形成表格。该识别方法是以电子图纸中的坐标信息为依据,进而确定表格中各个封闭单元格的位置,通过坐标比对在正确的封闭单元格内录入正确的文字内容,整个识别方法既降低了识别错误率,同时大大提高了识别效率。

A Method of Identifying Table Contents in Railway Drawings

The invention provides a method for identifying the contents of tables in railway drawings, which includes the following steps: step 1, identifying vertical and horizontal lines in tables, and reading coordinate information separately; step 2, establishing rectangular coordinate system according to the coordinate information, determining the points containing minimum abscissa and longitudinal coordinates as search points; step 3, searching intersection points, forming a closed list. Cell; Step 4, repeat step 3 as a new finding point until the whole table is formed; Step 5, read the coordinate information of each text content in the table and fill in the correct closed cell; Step 6, form the table. The recognition method is based on coordinate information in electronic drawings, and then determines the position of each enclosed cell in the table. Through coordinate comparison, the correct text content is input into the correct enclosed cell. The whole recognition method not only reduces the recognition error rate, but also greatly improves the recognition efficiency.

【技术实现步骤摘要】
一种识别铁路图纸中表格内容的方法
本专利技术涉及一种表格内容识别的方法,具体的说,涉及了一种识别铁路图纸中表格内容的方法。
技术介绍
在铁路图纸的设计过程中,设计人员通常以CAD或Visio等软件提供电子图纸,这些图纸是一系列的文字和矢量图形的总和。其他部门进行相关施工、检测等工作时需要对图纸中信息进行识别,由于这些图纸绘制复杂,图纸内容多,需要专业人员进行识别,费事费力;特别是表格信息的识别和读取,绘制人员除了通过肉眼进行识别,还需要判断、记录绘制出表格,并完成文字内容的录入。在大量相交关系错综复杂的直线中确定正确的单元格,并将相关的文字内容录入正确的单元格,其工作难度导致人员素质要求高,工程量巨大。为了解决以上存在的问题,人们一直在寻求一种理想的技术解决方案。
技术实现思路
本专利技术的目的是针对现有技术的不足,从而提供一种错误率低、识别效率高、降低人工成本、输出结果可靠的识别铁路图纸中表格内容的方法。为了实现上述目的,本专利技术所采用的技术方案是:一种识别铁路图纸中表格内容的方法,它包括以下步骤:步骤1,识别表格中的垂直直线和水平直线,并分别读取每根所述垂直直线和每根所述水平直线的坐标信息;步骤2,根据所述坐标信息建立直角坐标系,确定含有最小横坐标和最小纵坐标的点为查找点;步骤3,沿位于该查找点的水平直线正向查找首根与该水平直线相交的垂直直线,二者相交位置作为交叉点,沿位于该查找点的垂直直线正向查找首根与该垂直直线相交的水平直线,二者相交位置作为交叉点,所述查找点和所述交叉点形成封闭单元格;步骤4,将每个查找到的交叉点作为新的查找点重复步骤3,直至形成的封闭单元格包括含有最大横坐标和最大纵坐标的点;步骤5,读取表格中每段文字内容的坐标信息,将该文字内容的坐标信息分别与每个封闭单元格的坐标信息进行比对,逐一确定每段文字内容位于表格的位置;步骤6,形成表格,输出铁路图纸中由封闭单元格和文字内容组成的表格。基于上述,所述步骤1中,通过比较每根所述垂直直线两端的横坐标,判断是否为垂直直线,若两个横坐标的绝对值小于0.01则认为是垂直直线,反之则认为不是垂直直线;通过比较每根所述水平直线两端的纵坐标,判断是否为水平直线,若两个纵坐标的绝对值小于0.01则认为是垂直水平直线,反之则认为不是水平直线。基于上述,所述步骤2中还包括以下子步骤:子步骤1,在直角坐标系中,将所有垂直直线按照横坐标从小到大的顺序进行正向排序;子步骤2,在直角坐标系中,将所有水平直线按照纵坐标从小到大的顺序进行正向排序;子步骤3,确定表格的四个端点分别为(X1,Y1)、(X1,Yn)、(Xn,Y1)和(Xn,Yn),以(X1,Y1)作为查找点,n是正整数。基于上述,所述步骤5中通过确定每段文字内容的外边缘四点坐标进而确定每段文字位于所述直角坐标系的位置。基于上述,所述文字内容若有多段信息,则分别确定每段信息的坐标位置,根据与封闭单元格坐标信息的比对,确定文字内容的位置。本专利技术相对现有技术具有突出的实质性特点和显著的进步,具体的说,该识别铁路图纸中表格内容的方法是基于电子图纸中的坐标信息进行相关表格和文字内容的确定,通过建立坐标系确定每根所述垂直直线和每根所述水平直线的位置,并通过多次寻找查找点和交叉点,形成封闭单元格,进而高效率、低错误的绘制出表格,既降低了人工识别的错误率,同时大大提高了识别效率;表格确定后根据文字内容的坐标信息将相关文字内容填写进入正确的封闭单元格;整个识别方法准确性高、识别迅速、表格误差小,文字位置精确。附图说明图1是本专利技术的表格识别方法的流程示意图。图2是本专利技术中表格识别的具体结构示意图。具体实施方式下面通过具体实施方式,对本专利技术的技术方案做进一步的详细描述。实施例1如图1所示,一种识别铁路图纸中表格内容的方法,该方法是基于电子图纸的坐标信息进行相关位置识别,通过CAD或Visio等软件绘制的图纸,一旦成图图纸内直线、文字等信息既获得特定的坐标信息,本专利技术基于该坐标信息进行表格内容的识别,具体包括以下步骤:步骤1,识别表格中的垂直直线和水平直线,直线是由无数个点坐标构成的,铁路图纸一旦绘制完成,所述垂直直线和所述水平直线的个数、坐标信息就是确定的,基于铁路图纸分别读取每根所述垂直直线和每根所述水平直线的坐标信息。步骤2,本实施例中结合附图2建立直角坐标系,以此将读取到的坐标信息对应进入该直角坐标系,方便识别图纸中的各条直线,进而依据直角坐标系确定每根所述垂直直线和每根所述水平直线位于该直角坐标系的位置。本实施例中确定具有最小横坐标和最小纵坐标的点为查找点(X1,Y1)。然后按照步骤3和步骤4进行表格的绘制,确定表格中的每个封闭单元格位置。步骤3,沿位于该查找点(X1,Y1)的水平直线正向查找首根与该水平直线相交的垂直直线,二者相交位置作为交叉点(X1,Ya),沿位于该查找点(X1,Y1)的垂直直线正向查找首跟与该垂直直线相交的水平直线,二者相交位置作为交叉点(Xa,Y1),所述查找点和所述交叉点形成封闭单元格,由于单元格默认为四边形结构,确定三点后即可完成封闭单元格位置的确定,以此完成首次查找。由于表格中包含多个封闭单元格,故需要多次改变查找点进行查找和封闭单元格的确定,以已经确定的封闭单元格的端点(X1,Ya)和(Xa,Y1),再次进行查找进入步骤4。步骤4,将每个查找到的交叉点(X1,Ya)和(Xa,Y1)分别作为新的查找点重复步骤3,直至形成的封闭单元格包括含有最大横坐标和最大纵坐标的点(Xn,Yn);此时表格内所有封闭单元格查找完毕,进而整个表格框架形成。步骤5,读取表格中每段文字内容的坐标信息,将该文字内容的坐标信息分别与每个封闭单元格的坐标信息进行比对。以首个封闭单元格(X1,Y1)、(X1,Ya)、(Xa,Y1)和(Xa,Ya)举例,查找文字内容的最小横纵坐标和最大横纵坐标是否落入该封闭单元,如果是该文字内容位于首个封闭单元格,如果不是则查询其它封闭单元格进行比对。采用上述方法将每段文字内容的位置信息于封闭单元格的位置信息进行比对,进而完成表格中文字内容的填充。本实施例中为了方便文字识别给出了以下判断要求,所述步骤5中通过确定每段文字内容的外边缘的四点坐标,进而确定每段文字位于所述直角坐标系的位置。步骤6,形成表格,输出铁路图纸中由封闭单元格和文字内容组成的表格。该识别铁路图纸中表格内容的方法是基于现有电子图纸中的坐标信息进行的,通过确定表格内封闭单元格的位置和文字内容的位置,进而形成易于识别的表格,该表格可以采用WORD或者EXCEL格式直接输出,整个识别方法效率高、错误率低,有效的降低了人工识别的错误率和工作量。整个方法通过建立坐标系确定每根所述垂直直线和每根所述水平直线的位置,并通过多次寻找查找点和交叉点,形成封闭单元格,进而高效率、低错误的绘制出表格,既降低了人工识别的错误率和重复工作,同时大大提高了识别效率;表格确定后根据文字内容的坐标信息将相关文字内容填写进入正确的封闭单元格;整个识别方法准确性高、识别迅速、表格误差小,文字位置精确。实施例2本实施例基于实施例1的基础给出了一种具体的直线确定方法,通过比较每根所述垂直直线两端的横坐标,判断是否为垂直直线,若两个横坐标的绝对值小于0.01则认本文档来自技高网...

【技术保护点】
1.一种识别铁路图纸中表格内容的方法,其特征在于,它包括以下步骤:步骤1,识别表格中的垂直直线和水平直线,并分别读取每根所述垂直直线和每根所述水平直线的坐标信息;步骤2,根据所述坐标信息建立直角坐标系,确定含有最小横坐标和最小纵坐标的点为查找点;步骤3,沿位于该查找点的水平直线正向查找首根与该水平直线相交的垂直直线,二者相交位置作为交叉点,沿位于该查找点的垂直直线正向查找首根与该垂直直线相交的水平直线,二者相交位置作为交叉点,所述查找点和所述交叉点形成封闭单元格;步骤4,将每个查找到的交叉点作为新的查找点重复步骤3,直至形成的封闭单元格包括含有最大横坐标和最大纵坐标的点;步骤5,读取表格中每段文字内容的坐标信息,将该文字内容的坐标信息分别与每个封闭单元格的坐标信息进行比对,逐一确定每段文字内容位于表格的位置;步骤6,形成表格,输出铁路图纸中由封闭单元格和文字内容组成的表格。

【技术特征摘要】
1.一种识别铁路图纸中表格内容的方法,其特征在于,它包括以下步骤:步骤1,识别表格中的垂直直线和水平直线,并分别读取每根所述垂直直线和每根所述水平直线的坐标信息;步骤2,根据所述坐标信息建立直角坐标系,确定含有最小横坐标和最小纵坐标的点为查找点;步骤3,沿位于该查找点的水平直线正向查找首根与该水平直线相交的垂直直线,二者相交位置作为交叉点,沿位于该查找点的垂直直线正向查找首根与该垂直直线相交的水平直线,二者相交位置作为交叉点,所述查找点和所述交叉点形成封闭单元格;步骤4,将每个查找到的交叉点作为新的查找点重复步骤3,直至形成的封闭单元格包括含有最大横坐标和最大纵坐标的点;步骤5,读取表格中每段文字内容的坐标信息,将该文字内容的坐标信息分别与每个封闭单元格的坐标信息进行比对,逐一确定每段文字内容位于表格的位置;步骤6,形成表格,输出铁路图纸中由封闭单元格和文字内容组成的表格。2.根据权利要求1所述的一种识别铁路图纸中表格内容的方法,其特征在于:所述步骤1中,通过比较每根所述垂直直线两端的横坐标,判断是否为垂直直线,若两个横坐...

【专利技术属性】
技术研发人员:刘伟李海石成
申请(专利权)人:河南辉煌科技股份有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1