【技术实现步骤摘要】
本专利技术涉及图像识别,尤其涉及一种基于大模型的ocr图纸识别系统。
技术介绍
1、流程行业企业在经营过程中,通常会产生大量cad设计图纸文件,由于工厂体量大设备多,图纸文件数量巨大,在数字化转型过程中须要将图纸中关键信息提取到数字化信息系统中以便于精细化管理。纸张图纸一般由设计单位提供,交付给业主的都是pdf或图片格式,人工提取pdf或图片数据往往存在以下问题:
2、(1)文件数量大,一次提取工作图纸数量是以万为单位,需要人工通过专业软件一一打开图纸后才可识别,需要少则几人,多则十几二十人同时进行提取工作,仅仅打开关闭图纸就会消耗很多时间,几万张图纸最少需要耗时一两个月。
3、(2)打开后的图纸须要人工肉眼找到图纸中的标题栏,及提取标题栏表格中的字段信息,人工容易视觉疲劳,发生错行,漏读,添字等错误。
4、(3)人工操作,容易出现重复操作,提取过的文件没有标记,导致重复工作量。
5、(4)出现文件遗漏的情况,某个文件没有提取或者整个文件夹都没有提取。
6、(7)大量文件需要多
...【技术保护点】
1.一种基于大模型的OCR图纸识别系统,系统结构包括访问层、接口层、服务层和数据层;访问层提供给用户访问形式,接口层为访问层与服务层之间提供访问数据接口;数据层存储系统运行过程中的数据;其特征是
2.根据权利要求1所述的基于大模型的OCR图纸识别系统,其特征是所述数据层的数据库包括MySQL、MinIO和Redis;业务产生的数据存在MySQL,文件存在MinIO,频繁使用的数据则暂存于Redis。
3.根据权利要求1所述的基于大模型的OCR图纸识别系统,其特征是大模型的要求是具备正常语言理解能力;根据配置训练适用的OCR识别模型;
【技术特征摘要】
1.一种基于大模型的ocr图纸识别系统,系统结构包括访问层、接口层、服务层和数据层;访问层提供给用户访问形式,接口层为访问层与服务层之间提供访问数据接口;数据层存储系统运行过程中的数据;其特征是
2.根据权利要求1所述的基于大模型的ocr图纸识别系统,其特征是所述数据层的数据库包括mysql、minio和redis;业务产生的数据存在mysql,文件存在minio,频繁使用的数据则暂存于redis。
<...【专利技术属性】
技术研发人员:冯强,黄毅,李夫健,
申请(专利权)人:南京中图数码科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。