System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() PDF文件元器件提取装置、方法、电子设备及可读存储介质制造方法及图纸_技高网

PDF文件元器件提取装置、方法、电子设备及可读存储介质制造方法及图纸

技术编号:41237562 阅读:4 留言:0更新日期:2024-05-09 23:51
本发明专利技术提供了一种PDF文件元器件提取装置、方法、电子设备及可读存储介质,该装置包括:文件读取单元读取PDF文件;版面分析单元将PDF文件对应的全部页面转化为图片,通过标注框对识别得到的目标对应进行标注,以得到标注区域以及对应的目标标注信息;元器件提取单元根据标注区域和目标标注信息识别与提取元器件信息以汇整成Excel文件;输出单元根据Excel文件进行解析以获取元器件的信息,生成并输出相应的结果文件。通过本发明专利技术,对PDF文件分类识别和提取元器件基本信息,并自动生成相应的输出文件,提升元器件PDF文件信息识别的准确率和效率,以及减轻后续人工整理电子元器件信息数据和创建输出文件的工作量。

【技术实现步骤摘要】

本专利技术属于图像处理,具体涉及一种pdf文件元器件提取装置、方法、电子设备及可读存储介质。


技术介绍

1、电子元器件是现代电子设备的基本构成部分,其生产和使用广泛应用于各个行业,不同厂家不同型号的电子元器件都有其pdf文件说明书,正确快速地解析pdf文件中的有效信息并上传入库到相关数据库,对于现代电子设备行业发展至关重要。

2、然而,在电子元器件的数据信息入库过程中,正确快速地解析pdf文件中的有效信息是一件非常具有挑战的任务。传统上,人们需要手动查阅电子元器件的pdf文件,并将相关的电子元器件信息数据逐一记录上传到数据库,这种方式耗时且容易出错。随着电子元器件的种类和规模不断增加,传统的手动查阅电子元器件的pdf文件,入库相关信息数据的方法已经无法满足现代化的需求,通过人工操作需要耗费大量的人力和时间,而且容易给人造成视觉疲劳,出现人为错误,效率低下。


技术实现思路

1、为了克服现有技术的不足,本专利技术提供一种pdf文件元器件提取装置、方法、电子设备以及计算机可读存储介质,以解决现有技术需要通过人工查阅pdf文件以入库电子元器件数据,从而耗费大量时间和人力的技术问题。

2、为了解决上述技术问题,本专利技术采用的一个技术方案是:提供一种pdf文件元器件提取装置,包括:文件读取单元,用于读取pdf文件;其中,所述pdf文件存储和记录电子元器件的技术信息;版面分析单元,用于:将所述文件读取单元读取的所述pdf文件对应的全部页面转化为图片;对所述图片进行识别以通过标注框对识别得到的目标对应进行标注,以得到标注区域以及对应的目标标注信息;其中,所述标注区域包含位置坐标,所述目标标注信息包含目标标注类别以及元器件信息;元器件提取单元,用于根据所述版面分析单元得到的标注区域以及对应的目标标注信息,进行相应的元器件识别与提取,并将提取得到的信息汇整成表格形式以生成相应的excel文件;输出单元,用于根据所述元器件提取单元生成的excel文件进行解析以获取元器件的信息,以生成并输出相应的结果文件。

3、其中,所述目标标注类别至少包括基础信息、引脚图、引脚表格、封装图;当所述目标标注类别为基础信息时,所述元器件信息包括文字信息;当所述目标标注类别为引脚图时,所述元器件信息包括引脚名称、编号以及引脚名称与编号的对应关系;当所述目标标注类别为引脚表格时,所述元器件信息包括引脚信息和表格结构特征信息;当所述目标标注类别为封装图时,所述元器件信息包括图形信息和尺寸信息;所述元器件提取单元,包括:文字信息提取模块,用于读取所述目标标注类别为基础信息的标注区域;对所述标注区域包含的元器件信息进行识别和提取,得到相应的文字信息;以及将所述文字信息汇整成表格形式,以生成基本信息excel文件;封装图提取模块,用于读取所述目标标注类别为封装图的标注区域;对所述标注区域包含的元器件信息进行识别和提取,得到封装图的图形信息和尺寸信息;以及将所述图形信息和尺寸信息汇整成表格形式,以生成封装信息excel文件;引脚表格提取模块,用于读取所述目标标注类别为引脚表格的标注区域;对所述标注区域包含的元器件信息进行识别和提取,得到元器件的引脚信息和表格结构特征信息;以及将所述元器件的引脚信息和表格结构特征信息汇整成表格形式,以生成引脚信息excel文件;引脚图片提取模块,用于读取所述目标标注类别为引脚图片的标注区域;对所述标注区域包含的元器件信息进行识别和提取,得到元器件的引脚名称、编号以及引脚名称与编号的对应关系,从而获取所述引脚图片中元器件的引脚信息;以及将所述元器件的引脚信息汇整成表格形式,以生成引脚信息excel文件。

4、其中,所述元器件提取单元还包括标注类别分析模块,用于:根据所述版面分析单元得到的标注区域以及对应的目标标注信息,判断是否存在目标标注类别为引脚表格的标注区域;若是,关闭所述引脚图片提取模块的提取功能,并使所述引脚表格提取模块工作以对所述目标标注类别为引脚表格的标注区域进行识别与提取;否则,使所述引脚图片提取模块工作以对所述目标标注类别为引脚图片的标注区域进行识别与提取,并关闭所述引脚表格提取模块的提取功能。

5、其中,所述输出单元,用于:根据所述元器件提取单元生成的excel文件进行解析以获取元器件的引脚名称、引脚编号,并根据获取的元器件的引脚名称、引脚编号生成相应的kicad原理符号图,将所述kicad原理符号图作为结果文件输出;以及根据所述元器件提取单元生成的excel文件进行解析以及获取封装图的图形信息和尺寸信息,并根据获取的封装的图形信息和尺寸信息生成相应的封装文件和/或3d模型,并将所述封装文件和/或3d模型作为结果文件输出。

6、为了解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种pdf文件元器件提取方法,所述方法包括:读取pdf文件;其中,所述pdf文件存储和记录电子元器件的技术信息;将所述pdf文件对应的全部页面转化为图片,对所述图片进行识别以通过标注框对识别得到的目标对应进行标注,以得到标注区域以及对应的目标标注信息;其中,所述标注区域包含位置坐标,所述目标标注信息包含目标标注类别以及元器件信息;根据得到的所述标注区域以及对应的目标标注信息,进行相应的元器件识别与提取,并将提取得到的信息汇整成表格,以生成相应的excel文件;根据生成的excel文件进行解析以获取元器件的信息,以生成并输出相应的结果文件。

7、其中,所述目标标注类别至少包括基础信息、引脚图、引脚表格、封装图;当所述目标标注类别为基础信息时,所述元器件信息包括文字信息;当所述目标标注类别为引脚图时,所述元器件信息包括引脚名称、编号以及引脚名称与编号的对应关系;当所述目标标注类别为引脚表格时,所述元器件信息包括引脚信息和表格结构特征信息;当所述目标标注类别为封装图时,所述元器件信息包括图形信息和尺寸信息;当所述目标标注类别为基础信息时,“根据得到的所述标注区域以及对应的目标标注信息,进行相应的元器件识别与提取,并将提取得到的信息汇整成表格,以生成相应的excel文件”,具体通过如下步骤实现:根据得到的所述标注区域以及对应的目标标注信息,读取所述目标标注类别为基础信息的标注区域;对所述标注区域包含的元器件信息进行识别和提取,得到相应的文字信息;将所述文字信息汇整成表格形式,以生成基本信息excel文件;当所述目标标注类为封装图时,“根据得到的所述标注区域以及对应的目标标注信息,进行相应的元器件识别与提取,并将提取得到的信息汇整成表格,以生成相应的excel文件”,具体通过如下步骤实现:根据得到的所述标注区域以及对应的目标标注信息,读取所述目标标注类别为封装图的标注区域;对所述标注区域包含的元器件信息进行识别和提取,得到封装图的图形信息和尺寸信息;将所述图形信息和尺寸信息汇整成表格形式,以生成封装信息excel文件;当所述目标标注类为引脚表格时,“根据得到的所述标注区域以及对应的目标标注信息,进行相应的元器件识别与提取,并将提取得到的信息汇整成表格,以生成相应的excel文本文档来自技高网...

【技术保护点】

1.一种PDF文件元器件提取装置,其特征在于,包括:

2.如权利要求1所述的PDF文件元器件提取装置,其特征在于,所述目标标注类别至少包括基础信息、引脚图、引脚表格、封装图;当所述目标标注类别为基础信息时,所述元器件信息包括文字信息;当所述目标标注类别为引脚图时,所述元器件信息包括引脚名称、编号以及引脚名称与编号的对应关系;当所述目标标注类别为引脚表格时,所述元器件信息包括引脚信息和表格结构特征信息;当所述目标标注类别为封装图时,所述元器件信息包括图形信息和尺寸信息;

3.如权利要求2所述的PDF文件元器件提取装置,其特征在于,所述元器件提取单元还包括标注类别分析模块,用于:

4.如权利要求3所述的PDF文件元器件提取装置,其特征在于,所述输出单元,用于:

5.一种PDF文件元器件提取方法,其特征在于,所述方法包括:

6.如权利要求5所述的PDF文件元器件提取方法,其特征在于,所述目标标注类别至少包括基础信息、引脚图、引脚表格、封装图;当所述目标标注类别为基础信息时,所述元器件信息包括文字信息;当所述目标标注类别为引脚图时,所述元器件信息包括引脚名称、编号以及引脚名称与编号的对应关系;当所述目标标注类别为引脚表格时,所述元器件信息包括引脚信息和表格结构特征信息;当所述目标标注类别为封装图时,所述元器件信息包括图形信息和尺寸信息;

7.如权利要求6所述的PDF文件元器件提取方法,其特征在于,“根据生成的Excel文件进行解析以获取元器件的信息,以生成并输出相应的结果文件”,具体包括:

8.如权利要求5所述的PDF文件元器件提取方法,其特征在于,所述目标标注类别至少包括基础信息、引脚图、引脚表格、封装图;当所述目标标注类别为基础信息时,所述元器件信息包括文字信息;当所述目标标注类别为引脚图时,所述元器件信息包括引脚名称、编号以及引脚名称与编号的对应关系;当所述目标标注类别为引脚表格时,所述元器件信息包括引脚信息和表格结构特征信息;当所述目标标注类别为封装图时,所述元器件信息包括图形信息和尺寸信息;

9.一种电子设备,包括:处理器和存储器,其特征在于,存储器用于存储计算机程序代码,计算机程序代码包括计算机指令,当处理器执行所述计算机指令时,电子设备执行如权利要求5~8任意一项所述的PDF文件元器件提取方法的步骤。

10.一种可读存储介质,可读存储介质中存储有计算机程序,其特征在于,计算机程序包括程序指令,程序指令当被电子设备的处理器执行时,使处理器执行如权利要求5~8任意一项所述的PDF文件元器件提取方法的步骤。

...

【技术特征摘要】

1.一种pdf文件元器件提取装置,其特征在于,包括:

2.如权利要求1所述的pdf文件元器件提取装置,其特征在于,所述目标标注类别至少包括基础信息、引脚图、引脚表格、封装图;当所述目标标注类别为基础信息时,所述元器件信息包括文字信息;当所述目标标注类别为引脚图时,所述元器件信息包括引脚名称、编号以及引脚名称与编号的对应关系;当所述目标标注类别为引脚表格时,所述元器件信息包括引脚信息和表格结构特征信息;当所述目标标注类别为封装图时,所述元器件信息包括图形信息和尺寸信息;

3.如权利要求2所述的pdf文件元器件提取装置,其特征在于,所述元器件提取单元还包括标注类别分析模块,用于:

4.如权利要求3所述的pdf文件元器件提取装置,其特征在于,所述输出单元,用于:

5.一种pdf文件元器件提取方法,其特征在于,所述方法包括:

6.如权利要求5所述的pdf文件元器件提取方法,其特征在于,所述目标标注类别至少包括基础信息、引脚图、引脚表格、封装图;当所述目标标注类别为基础信息时,所述元器件信息包括文字信息;当所述目标标注类别为引脚图时,所述元器件信息包括引脚名称、编号以及引脚名称与编号的对应关系;当所述目标标注类别为引脚表格时,所述元器件信息包括引脚信息和表格结...

【专利技术属性】
技术研发人员:邹风院李梓和谢巧琳吴政翰潘昌武李楠余京泽
申请(专利权)人:粤港澳大湾区广东国创中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1