工程图纸矢量化和图元语义提取方法技术

技术编号：8215872 阅读：252 留言：0更新日期：2013-01-17 15:33

本发明专利技术工程图纸矢量化和图元语义提取方法，包括如下步骤：S1，利用脚本语言提取PDF图纸文件中的信息数据或生成对应BMP格式图像数据，并对图像格式的文件进行进一步预处理；S2，利用种子段算法对图像数据中的直线图元进行矢量化；S3，对图像数据中的圆/圆弧进行矢量化；S4，图元关系识别，利用基于连通区域的图文分离算法去除图纸图像上的标注框、文字信息；S5，输出结果。本发明专利技术工程图纸矢量化和图元语义提取方法通过对图文分离算法的预处理，以及对种子段矢量化方法的改进，提高了矢量化的准确率和处理速度；同时通过规则匹配算法，较好地解决了图样语义信息的提取难题，为机器智能读图以及三维重建提供了较好的数据基础。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及工程图纸图元语义信息提取及图纸矢量化

技术介绍
光栅图像矢量化(Raster to Vector Conversion,简称为RVC),就是利用计算机图形学、数字图像处理、人工智能等综合技术，把通过扫描仪输入到计算机中的以光栅图像格式保存的工程图，识别成矢量图形，最后以CAD软件能够识别的格式保存的过程。光栅图形矢量化，不仅在机械设计领域，更在各种工程设计、地理信息等行业具有广泛的应用前景，具有重要的理论和实践意义。另外，除了图元信息外，一张实际工程图纸主要由图形元素、尺寸标注、文字等三部分构成。可由如下形式表达P={E，D，T}其中，P-工程图纸，E-图形元素，D-尺寸标注，T-文本说明这三部分所表达的各种信息构成了工程图样语义的主要内容。其中的文字说明部分包括产品的一些材料、精度、加工要求等信息。一般这些说明不涉及零件的三维形体信息，所以通常意义上的图样语义是指图形和尺寸标注两方面。通过标注提取和文字提取，可以为矢量化后的图纸数据的三维重建提供基础。常见的矢量化方法有基于细化的算法、动态骨架算法、轮廓匹配算法、网格模式算法和基于游程算法等以及基于整体识别的种子段算法等，同时也有将人工智能技术融合到矢量化方法当中，如神经网络技术和模糊识别技术等。图元语义提取涉及的方法主要有规则匹配、图文分离、文字识别三块内容。规则匹配是利用固定的规则判断出标注线、外型线、箭头、消隐线等图元；图文分离的主要目的是从图文混合的工程图中，将所有字符标注分离出来，本质上属于一种图像分割算法，通常利用轮廓特征进行判定；文字识别主要利用特征量算法实现。目前...

【技术保护点】
工程图纸矢量化和图元语义提取方法，其特征在于，包括如下步骤：S1，利用脚本语言提取PDF图纸文件中的信息数据或生成对应BMP格式图像数据，并对图像格式的文件进行进一步预处理；S2，利用种子段算法对图像数据中的直线图元进行矢量化；S3，对图像数据中的圆/圆弧进行矢量化；S4，图元关系识别，利用基于连通区域的图文分离算法去除图纸图像上的标注框、文字信息；S5，输出结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：孙煦峰，吴康宁，陶余会，赵亮，
申请(专利权)人：上海中和软件有限公司，上海复旦复华科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人