一种基于多模态大语言模型的智能审图方法及系统技术方案

技术编号:46624277 阅读:0 留言:0更新日期:2025-10-14 21:20
本申请涉及图像处理领域,公开了一种基于多模态大语言模型的智能审图方法及系统,其中方法包括:获取待审查的目标工程设计图纸和审查任务描述;基于目标工程设计图纸生成全局概览图;通过多模态大语言模型根据全局概览图和审查任务描述进行全局语义分析,生成全局语义分析结果和待审查的局部区域提议信息;从设计图纸中裁剪局部图像;通过多模态大语言模型对局部图像进行要素识别解析,得到局部结构化信息;将局部结构化信息和全局语义分析结果进行信息融合处理,生成完整图纸信息后与结构化规范知识库进行合规性校验和缺陷定位,生成审查报告。本申请能够实现对电网工程设计图纸的智能化审查,提高审查效率和准确性,同时降低资源消耗。

【技术实现步骤摘要】

本申请涉及图像处理,具体涉及一种基于多模态大语言模型的智能审图方法及系统


技术介绍

1、电网工程设计图纸信息密度高、复杂度强,其设计质量直接关系电网运行安全稳定,高效精准的图纸审查至关重要。目前,图纸审查高度依赖人工专家。一方面,经验丰富的审图专家需要长时间培养,人力资源稀缺;另一方面,资深专家审查单张复杂变电站图纸需30-60分钟,且易因疲劳遗漏2-3毫米的设备编号、参数标注等细节,问题漏检率较高,难以满足电网工程推进需求。

2、虽然现有技术提出了基于计算机视觉技术的自动审图系统,但现有方案存在以下一些缺陷,例如,基于深度学习的全图检测方法处理高分辨率图纸时计算量大,图像下采样还会丢失小型设备信息,识别准确率低;滑动窗口方法虽解决内存问题,但会导致设备识别失败、效率低及无法理解图纸整体拓扑的问题;多尺度特征金字塔网络方法仍依赖全图处理,效率无根本改善,且尺度固定无法灵活适配任务。可见,现有技术存在审图效率低下和准确性不足的问题,且容易造成资源浪费,无法满足实际审图需求。

3、前面的叙述在于提供一般的背景信息,并不一定构成现有技术本文档来自技高网...

【技术保护点】

1.一种基于多模态大语言模型的智能审图方法,其特征在于,包括:

2.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述基于所述目标工程设计图纸,生成对应的全局概览图,包括:

3.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述通过预设的多模态大语言模型根据所述全局概览图和所述审查任务描述进行全局语义分析,得到全局语义分析结果,包括:

4.根据权利要求3所述的多模态大语言模型的智能审图方法,其特征在于,所述基于所述全局语义分析结果生成至少一个待审查的局部区域提议信息,包括:

5.根据权利要求1所述...

【技术特征摘要】

1.一种基于多模态大语言模型的智能审图方法,其特征在于,包括:

2.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述基于所述目标工程设计图纸,生成对应的全局概览图,包括:

3.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述通过预设的多模态大语言模型根据所述全局概览图和所述审查任务描述进行全局语义分析,得到全局语义分析结果,包括:

4.根据权利要求3所述的多模态大语言模型的智能审图方法,其特征在于,所述基于所述全局语义分析结果生成至少一个待审查的局部区域提议信息,包括:

5.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述根据所述待审查的局部区域提议信息,从所述目标工程设计图纸中裁剪对应的至少一个局部...

【专利技术属性】
技术研发人员:许智贤何平朱晓伟关维坚利嘉骥陈安记敖卓浪张强关震东梁启党
申请(专利权)人:广东电网有限责任公司阳江供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1