【技术实现步骤摘要】
本专利技术涉及电子设计自动化,具体涉及一种从pdf格式元器件手册中自动提取符号图参数的方法。
技术介绍
1、在pcb eda的符号图设计工具、元器件选型工具中,元器件符号图数据库是必不可少的。由于元器件的种类繁多、同一种类中又有多种型号,总的型号数量可达上千万种。除了pcb eda工具之外,很多大中型电子企业都会建立自己的元器件库、电子元件销售平台、pcb贴片厂也都需要建库或者更新自己的商品信息。
2、当前符号图模型建库工作,基本都依赖人工去翻阅元器件数据手册,寻找到元器件符号图之后,逐一将相关参数录入到数据库中。这些手册基本都是pdf格式,少则几十页,多则几千页,且其中的元器件符号图种类繁多,不同厂家的绘图规范也各不相同。因此,建库工作需要使用大量的人力做简单重复工作,且效率低,出错难以被发现。
3、尽管市场目前出现了少量半自动的符号图建库工具,但仍需人工逐页翻阅元器件数据手册,然后人工对符号图做类别判断和框选,之后使用通用ocr工具做识别,最后人工做校正录入。这种工具忽视了当前大部分元器件手册中的符号图是可编
...【技术保护点】
1.一种从PDF格式元器件手册中自动提取符号图参数的方法,其特征在于:包括PDF格式元器件手册预处理模块、可编辑元器件符号图参数提取模块、表格型BGA图像类元器件符号图参数识别与提取模块、非表格型BGA图像类元器件符号图参数识别与提取模块和符号图参数格式转换模块;
2.如权利要求1所述从PDF格式元器件手册中自动提取符号图参数的方法,其特征在于:所述电子元器件符号图分类识别方法,包括确定元器件符号图的类型数,从PDF格式元器件手册中选取双列型、四边形、线圈型BGA以及表格型BGA元器件图片作为数据集;采用Resnet50作为分类器的主体结构,搭建分类网络,
...【技术特征摘要】
1.一种从pdf格式元器件手册中自动提取符号图参数的方法,其特征在于:包括pdf格式元器件手册预处理模块、可编辑元器件符号图参数提取模块、表格型bga图像类元器件符号图参数识别与提取模块、非表格型bga图像类元器件符号图参数识别与提取模块和符号图参数格式转换模块;
2.如权利要求1所述从pdf格式元器件手册中自动提取符号图参数的方法,其特征在于:所述电子元器件符号图分类识别方法,包括确定元器件符号图的类型数,从pdf格式元器件手册中选取双列型、四边形、线圈型bga以及表格型bga元器件图片作为数据集;采用resnet50作为分类器的主体结构,搭建分类网络,使用数据集训练网络,得到包含权重参数的分类模型。
3.如权利要求1所述从pdf格式元器件手册中自动提取符号图参数的方法,其特征在于:所述符号图语义对齐方法中:
4.如权利要求1所述从pdf格式元器件手册中自动提取符号图参数的方法,其特征在于:进行ocr识别时,选取pdf格式元器件手册中元器件符号图中出现的字符,包括数字、英文字母、希腊字符、电气特性的描述符号及其带上划线的字符作为准备数据;采用resnet50作为基础骨架,结合dbnet搭建文本检测网络;使用transformer提取检测到的视觉序列特征,使用attention方式预测字符。
5.如权利要求1所述从pdf格式元器件手册中自动提取符号图参数的方法,其特征在于:所述pdf格式元器件手册预处理模块进行预处理时,输入pdf格式元器件手册,对pdf格式元器件手册的合法性做判断,正常打开则进入下一步骤,无法打开则提示并退出;判断pdf格式元器件手册是否有水印,若有水印则做去水印处理;删除pdf格式元器件手册中所有的纯文字页,对剩下的页根据关键字做搜索,判断是否存在可编辑表格型bga元器件符号图,得到该手册中所有可编辑表格型bga符号图的起止页码;创建一个json文件“symbols_basicinfo.json”,继续删除pdf格式元器件手册中所有的表格页,将剩余页转换为jpg格式图片,采用电子元器件符号图分类识别方法,做搜...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。