【技术实现步骤摘要】
一种采用机器学习进行图纸布局分类识别的方法
本专利技术涉及一种用于图纸处理领域的采用机器学习进行图纸布局分类识别的方法。
技术介绍
图纸是一种市政规划、工程建筑、机械设计等诸多领域的常用技术文件。在图纸打印输出为图纸电子文件后,图纸内容以图像或图形形式存在,其中所包含的大量原始要素信息就丢失了。如市政规划的详细控制图纸是电网建设规划中的重要依据和资料来源,它们在公开发布/发行时,图纸中的文字,图层,图形,色块等都已转换为图形或图像。这给使用中图纸要素信息的识别和提取带来极大不便。由于图纸要素复杂,根据图纸中所包含的要素内容,图纸要素区域可分为图形区域、表格文字区域、标题区域、图例区域等。图纸要素布局的边界可根据图框及分割线进行划定,图纸中要素区域形状为矩形。不同来源图纸的要素布局不统一,相同类别的图纸,图框及分割线的布局位置相对固定。由于不同图纸要素区域中的内容识别和信息提取方法具有显著差异,图纸布局结构的分类识别是后续图纸要素区域内容识别和信息提取的基础,也是技术人员的主要目标。
技术实现思路
...
【技术保护点】
1.一种采用机器学习进行图纸布局分类识别的方法,其特征在于,包括如下步骤:/n步骤1,图纸布局特征提取,具体步骤如下;/n步骤1.1,图形文件的图像化转换,将不同类型的图纸文件,分页转换为图纸图像;/n步骤1.2,对图纸图像进行灰度化处理后,使用OTSU算法完成二值化处理,得到二值化图纸图像;/n步骤1.3,二值化图纸图像,提取图纸边框及分割线的线条,通过腐蚀ERODE及膨胀DILATE算法,去除无关图像、线条噪声后,使用水平及垂直的单像素宽度矩形形态转换方法,提取图形中的水平集垂直线条,合并形成图纸的线图图像;/n步骤1.4,对线图图像进行归一化处理,将不同大小的图纸线条 ...
【技术特征摘要】
1.一种采用机器学习进行图纸布局分类识别的方法,其特征在于,包括如下步骤:
步骤1,图纸布局特征提取,具体步骤如下;
步骤1.1,图形文件的图像化转换,将不同类型的图纸文件,分页转换为图纸图像;
步骤1.2,对图纸图像进行灰度化处理后,使用OTSU算法完成二值化处理,得到二值化图纸图像;
步骤1.3,二值化图纸图像,提取图纸边框及分割线的线条,通过腐蚀ERODE及膨胀DILATE算法,去除无关图像、线条噪声后,使用水平及垂直的单像素宽度矩形形态转换方法,提取图形中的水平集垂直线条,合并形成图纸的线图图像;
步骤1.4,对线图图像进行归一化处理,将不同大小的图纸线条图像缩放为统一大小;
步骤1后得到统一大小的灰度图像,即为图纸布局特征图像;
步骤2,机器学习模型训练,具体步骤如下;
步骤2.1,训练及验证数据集的准备,选择一定数量的各类型图纸文件,执行第一步的图纸布局...
【专利技术属性】
技术研发人员:储琳琳,宗明,张宇俊,肖业凡,朱夏,王经纬,顾志铭,翟清纲,辛洪波,张晓莉,
申请(专利权)人:国网上海市电力公司,上海科路信息技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。