【技术实现步骤摘要】
本申请涉及图像处理,具体涉及一种基于多模态大语言模型的智能审图方法及系统。
技术介绍
1、电网工程设计图纸信息密度高、复杂度强,其设计质量直接关系电网运行安全稳定,高效精准的图纸审查至关重要。目前,图纸审查高度依赖人工专家。一方面,经验丰富的审图专家需要长时间培养,人力资源稀缺;另一方面,资深专家审查单张复杂变电站图纸需30-60分钟,且易因疲劳遗漏2-3毫米的设备编号、参数标注等细节,问题漏检率较高,难以满足电网工程推进需求。
2、虽然现有技术提出了基于计算机视觉技术的自动审图系统,但现有方案存在以下一些缺陷,例如,基于深度学习的全图检测方法处理高分辨率图纸时计算量大,图像下采样还会丢失小型设备信息,识别准确率低;滑动窗口方法虽解决内存问题,但会导致设备识别失败、效率低及无法理解图纸整体拓扑的问题;多尺度特征金字塔网络方法仍依赖全图处理,效率无根本改善,且尺度固定无法灵活适配任务。可见,现有技术存在审图效率低下和准确性不足的问题,且容易造成资源浪费,无法满足实际审图需求。
3、前面的叙述在于提供一般的背景信息,
...【技术保护点】
1.一种基于多模态大语言模型的智能审图方法,其特征在于,包括:
2.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述基于所述目标工程设计图纸,生成对应的全局概览图,包括:
3.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述通过预设的多模态大语言模型根据所述全局概览图和所述审查任务描述进行全局语义分析,得到全局语义分析结果,包括:
4.根据权利要求3所述的多模态大语言模型的智能审图方法,其特征在于,所述基于所述全局语义分析结果生成至少一个待审查的局部区域提议信息,包括:
5
...【技术特征摘要】
1.一种基于多模态大语言模型的智能审图方法,其特征在于,包括:
2.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述基于所述目标工程设计图纸,生成对应的全局概览图,包括:
3.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述通过预设的多模态大语言模型根据所述全局概览图和所述审查任务描述进行全局语义分析,得到全局语义分析结果,包括:
4.根据权利要求3所述的多模态大语言模型的智能审图方法,其特征在于,所述基于所述全局语义分析结果生成至少一个待审查的局部区域提议信息,包括:
5.根据权利要求1所述的基于多模态大语言模型的智能审图方法,其特征在于,所述根据所述待审查的局部区域提议信息,从所述目标工程设计图纸中裁剪对应的至少一个局部...
【专利技术属性】
技术研发人员:许智贤,何平,朱晓伟,关维坚,利嘉骥,陈安记,敖卓浪,张强,关震东,梁启党,
申请(专利权)人:广东电网有限责任公司阳江供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。