【技术实现步骤摘要】
一种位图格式钢筋图纸数据提取方法和系统
[0001]本专利技术属于建筑施工
,具体涉及一种位图格式钢筋图纸数据提取方法和系统。
技术介绍
[0002]位图格式钢筋图纸是工程施工中常用的文件格式,通常通过矢量格式打印成位图格式保存或对工程白图、蓝图进行扫描保存,因此施工图中的钢筋线、钢筋标注、钢筋明细表均由像素点组成,并非有效的数据信息,若需要提取图纸中的相关信息,比如钢筋大样或者钢筋明细表,只能在CAD软件中重新绘图或在Excel中手工录入数据,该过程存在大量的重复性劳动,且耗时费力。
[0003]当前现有技术中,可以采用OpenCV等图形识别技术对图纸中的线条进行识别,但识别过程中可能存在钢筋线条和文字都将被识别为单线、双线、短线的问题;还可以采用OCR技术进行文字提取,但在本场景中,钢筋标注信息散落在图纸中的各个地方,可能会受到文字附近线条的干扰,造成文字识别的正确率低。
技术实现思路
[0004]为了解决现有钢筋数据提取过程中存在的钢筋线条和文字都将被识别为线条的问题,以及文字识别的正确率 ...
【技术保护点】
【技术特征摘要】
1.一种位图格式钢筋图纸数据提取方法,其特征在于,包括如下步骤:S1、对包含钢筋图纸数据的位图格式的图片进行全图识别得到图纸数据中的文本框和直线,根据识别到的所有文本框的高度得到所述钢筋图纸数据的特征值hc;根据特征值hc和识别到的水平直线得到钢筋图纸数据中的钢筋明细表的区域;S2、针对钢筋明细表的区域,识别其中的文字;针对钢筋明细表外的区域,识别其中的钢筋线条和文字。2.如权利要求1所述的位图格式钢筋图纸数据提取方法,其特征在于,所述步骤S1中还包括对识别出来的直线进行合并,方法如下:遍历所有的相邻的平行线,当两条相邻平行线L
A
和L
B
的间距小于特征值hc的第一设定倍数,且从L
A
的任一端点向L
B
作垂足,垂足点在L
B
两个端点之间,则删除L
A
和L
B
中长度较短的线,将L
A
和L
B
中长度较长的线进行延长得到一根总长线L
AB
;所述总长线L
AB
的两个端点的坐标分别取L
A
投影至L
B
合成后的两个端点。3.如权利要求1所述的位图格式钢筋图纸数据提取方法,其特征在于,所述步骤S1中还包括对识别出来的线条进行修直,当一条直线的两个端点的水平坐标的差值dx小于特征值hc的第六设定倍数时,将该线条修直为垂直线;当一条直线的两个端点的垂直坐标的差值dy小于特征值hc的第六设定倍数时,将该线条修直为水平线。4.如权利要求1~3任一项所述的位图格式钢筋图纸数据提取方法,其特征在于,所述步骤S1中得到钢筋明细表的区域的方法如下:S1.1、对识别出的所有水平线循环进行双线对比,寻找3根满足以下条件1的相邻线;条件1:长度均大于特征值hc的第二设定倍数;间距小于特征值hc的第三设定倍数;长度差值小于特征值hc的第四设定倍数;左侧端点的水平坐标的差值小于特征值hc的第五设定倍数;S1.2、基于所述3根相邻线的最上面一条线和最下面一条线分别向上和向下不断寻找满足条件1的相邻线;S1.3、满足条件1的所有相邻线中的顶线的左端点坐标和底线右端点坐标所确定的区域为钢筋表区域。5.如权利要求1~3任一项所述的位图格式钢筋图纸数据提取方法,其特征在于,所述步骤S2中,还包括将钢筋图纸数据的原始位图分辨率转换成高清图,其放大系数记为f。6.如权利要求5所述的位图格式钢筋图纸数据提取方法,其特征在于,所述步骤S2中,针对钢筋明细表的区域,识别其中的文字的方法包括:S201.1、获取钢筋明细表区域中的每个文本框的定位坐标值;S201.2、对文本框进行修正,所述修正包括去边框运算、去除框外框和框合并运算;S201.3、逐...
【专利技术属性】
技术研发人员:朱明清,程茂林,涂同珩,夏昊,李冬冬,潘道辉,张晓平,吴中正,陈斌,严双桥,
申请(专利权)人:中交第二航务工程局有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。