基于目标检测语义分割和OCR的文件转换方法和系统技术方案

技术编号：41322831 阅读：9 留言：0更新日期：2024-05-13 15:01

本发明专利技术提出了基于目标检测语义分割和OCR的文件转换方法和系统。所述基于目标检测语义分割和OCR的CAD文件转换方法包括：收集数据并利用所述数据对用于识别图纸元素的卷积神经网路模型进行训练，获得训练后的卷积神经网路模型，作为图纸元素识别模型；将OCR的图纸文件输入至图纸元素识别模型中获取所述OCR的图纸文件对应的图纸元素；利用所述OCR的图纸文件对应的图纸元素生成与所述CAD文件对应的dxf文件。所述系统包括所述方法步骤对应的模块。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术提出了基于目标检测语义分割和ocr的文件转换方法和系统，属于文件转换。

技术介绍

1、现有软件通过提取图片中各元素的边缘信息，将原图转换为只包含轮廓的矢量图，再导入cad软件中进行编辑。只能保留图片中各元素的轮廓信息，丢失了其具体属性和内部信息，生成的cad文件只是多边形的组合，无法正常编辑修改。

技术实现思路

1、本专利技术提供了基于目标检测语义分割和ocr的cad文件转换方法和系统，用以解决只能保留图片中各元素的轮廓信息，丢失了其具体属性和内部信息，生成的cad文件只是多边形的组合，无法正常编辑修改的问题：

2、基于目标检测语义分割和ocr的cad文件转换方法，所述基于目标检测语义分割和ocr的cad文件转换方法包括：

3、收集数据并利用所述数据对用于识别图纸元素的卷积神经网路模型进行训练，获得训练后的卷积神经网路模型，作为图纸元素识别模型；

4、将ocr的图纸文件输入至图纸元素识别模型中获取所述ocr的图纸文件对应的图纸元素；

5、利用所述ocr的图纸文件对应的图纸元素生成与所述cad文件对应的dxf文件。

6、进一步地，收集数据并利用所述数据对用于识别图纸元素的卷积神经网路模型进行训练，获得训练后的卷积神经网路模型，作为图纸元素识别模型，包括：

7、收集不同种类图纸的图片样本数据；其中，所述图像样本数据包括线、圆、文字等其他图纸元素；

8、针对所述图片样本数据创建与所述图片样本数据

9、利用所述训练数据对卷积神经网路模型进行训练，获得完成训练的卷积神经网路模型，并将所述完成训练的卷积神经网路模型作为图纸元素识别模型。

10、进一步地，将ocr的图纸文件输入至图纸元素识别模型中获取所述ocr的图纸文件对应的图纸元素，包括：

11、将ocr的图纸文件输入至图纸元素识别模型；

12、所述至图纸元素识别模型通过元素识别获取所述ocr的图纸文件所包含的图纸元素；

13、针对所述ocr的图纸文件所包含的图纸元素进行语义分割，获得不同的语义区域，其中，所述语义区域与所述ocr的图纸文件所包含的图纸元素进行一一对应；

14、提取所述语义区域对应的文字内容；

15、将所述语义区域对应的文字内容与所述ocr的图纸文件所包含的图纸元素之间建立关联关系。

16、进一步地，利用所述ocr的图纸文件对应的图纸元素生成与所述cad文件对应的dxf文件，包括：

17、提取ocr的图纸文件所包含的图纸元素对应的几何特征；

18、根据关联关系调取与所述几何特征对应的文字内容；

19、针对所述ocr的图纸文件所包含的图纸元素对应的几何特征和几何特征对应的文字内容创建与所述cad文件对应的dxf文件；

20、对所述cad文件对应的dxf文件进行验证，确保几何特征的正确率和文字内容的正确率。

21、进一步地，对所述cad文件对应的dxf文件进行验证，确保几何特征的正确率和文字内容的正确率，包括：

22、步骤一：设当前需要评价的cad文件中，总的几何特征为ma，生成的对应的dxf文件中正确的几何特征为mb，则当前需要评价的cad文件中几何特征的正确率为：

23、

24、其中p(m)为当前需要评价的cad文件中几何特征的正确率；

25、步骤二：设当前需要评价的cad文件中，总的文字内容为na，生成的对应的dxf文件中正确的文字内容为nb，则当前需要评价的cad文件中文字内容的正确率为：

26、

27、其中p(n)为当前需要评价的cad文件中文字内容的正确率；

28、步骤三：根据步骤一和步骤二的计算结果，计算模型的综合正确率，其计算公式如下：

29、

30、其中p为模型的综合正确率。当p大于等于0.9时表明模型的综合正确率达到良好状态，否则说明模型的综合正确率未达到预设良好状态。

31、基于目标检测语义分割和ocr的cad文件转换系统，所述基于目标检测语义分割和ocr的cad文件转换系统包括：

32、模型训练模块，用于收集数据并利用所述数据对用于识别图纸元素的卷积神经网路模型进行训练，获得训练后的卷积神经网路模型，作为图纸元素识别模型；

33、图纸元素获取模块，用于将ocr的图纸文件输入至图纸元素识别模型中获取所述ocr的图纸文件对应的图纸元素；

34、dxf文件生成模块，用于利用所述ocr的图纸文件对应的图纸元素生成与所述cad文件对应的dxf文件。

35、进一步地，所述模型训练模块包括：

36、样本数据收集模块，用于收集不同种类图纸的图片样本数据；其中，所述图像样本数据包括线、圆、文字等其他图纸元素；

37、训练数据创建模块，用于针对所述图片样本数据创建与所述图片样本数据对应的包含cad软件对应的dxf文件的训练数据；

38、识别模型获取模块，用于利用所述训练数据对卷积神经网路模型进行训练，获得完成训练的卷积神经网路模型，并将所述完成训练的卷积神经网路模型作为图纸元素识别模型。

39、进一步地，所述图纸元素获取模块包括：

40、图纸文件输入模块，用于将ocr的图纸文件输入至图纸元素识别模型；

41、元素获取执行模块，用于所述至图纸元素识别模型通过元素识别获取所述ocr的图纸文件所包含的图纸元素；

42、语义区域获取模块，用于针对所述ocr的图纸文件所包含的图纸元素进行语义分割，获得不同的语义区域，其中，所述语义区域与所述ocr的图纸文件所包含的图纸元素进行一一对应；

43、文字内容提取模块，用于提取所述语义区域对应的文字内容；

44、关联关系建立模块，用于将所述语义区域对应的文字内容与所述ocr的图纸文件所包含的图纸元素之间建立关联关系。

45、进一步地，所述dxf文件生成模块包括：

46、几何特征提取模块，用于提取ocr的图纸文件所包含的图纸元素对应的几何特征；

47、文字内容调取执行模块，用于根据关联关系调取与所述几何特征对应的文字内容；

48、文件创建模块，用于针对所述ocr的图纸文件所包含的图纸元素对应的几何特征和几何特征对应的文字内容创建与所述cad文件对应的dxf文件；

49、正确定验证模块，用于对所述cad文件对应的dxf文件进行验证，确保几何特征的正确率和文字内容的正确率。

50、进一步地，正确定验证模块的运行过程包括：

51、步骤一：设当前需要评价的cad文件中，总的几何特征为ma，生成的对应的dxf文件中正确的几何特征为mb，则当前需要评价的cad文件中几何特征的正确率为：

本文档来自技高网...

【技术保护点】

1.基于目标检测语义分割和OCR的文件转换方法，其特征在于，所述基于目标检测语义分割和OCR的文件转换方法包括：

2.根据权利要求1所述基于目标检测语义分割和OCR的文件转换方法，其特征在于，收集数据并利用所述数据对用于识别图纸元素的卷积神经网路模型进行训练，获得训练后的卷积神经网路模型，作为图纸元素识别模型，包括：

3.根据权利要求1所述基于目标检测语义分割和OCR的文件转换方法，其特征在于，将OCR的图纸文件输入至图纸元素识别模型中获取所述OCR的图纸文件对应的图纸元素，包括：

4.根据权利要求1所述基于目标检测语义分割和OCR的文件转换方法，其特征在于，利用所述OCR的图纸文件对应的图纸元素生成与所述CAD文件对应的dxf文件，包括：

5.根据权利要求4所述基于目标检测语义分割和OCR的文件转换方法，其特征在于，对所述CAD文件对应的dxf文件进行验证，确保几何特征的正确率和文字内容的正确率，包括：

6.基于目标检测语义分割和OCR的文件转换系统，其特征在于，所述基于目标检测语义分割和OCR的文件转换系统包括：p>

7.根据权利要求6所述基于目标检测语义分割和OCR的文件转换系统，其特征在于，所述模型训练模块包括：

8.根据权利要求6所述基于目标检测语义分割和OCR的文件转换系统，其特征在于，所述图纸元素获取模块包括：

9.根据权利要求6所述基于目标检测语义分割和OCR的文件转换系统，其特征在于，所述dxf文件生成模块包括：

10.根据权利要求9所述基于目标检测语义分割和OCR的文件转换系统，其特征在于，正确定验证模块的运行过程包括：

...

【技术特征摘要】

1.基于目标检测语义分割和ocr的文件转换方法，其特征在于，所述基于目标检测语义分割和ocr的文件转换方法包括：

2.根据权利要求1所述基于目标检测语义分割和ocr的文件转换方法，其特征在于，收集数据并利用所述数据对用于识别图纸元素的卷积神经网路模型进行训练，获得训练后的卷积神经网路模型，作为图纸元素识别模型，包括：

3.根据权利要求1所述基于目标检测语义分割和ocr的文件转换方法，其特征在于，将ocr的图纸文件输入至图纸元素识别模型中获取所述ocr的图纸文件对应的图纸元素，包括：

4.根据权利要求1所述基于目标检测语义分割和ocr的文件转换方法，其特征在于，利用所述ocr的图纸文件对应的图纸元素生成与所述cad文件对应的dxf文件，包括：

5.根据权利要求4所述基于目标检测语...

【专利技术属性】
技术研发人员：余丹，兰雨晴，张博煜，贺江，邢智涣，
申请(专利权)人：慧之安信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人