查询变换器的训练方法、多模态大模型预训练方法及电力系统变电站检修方法技术方案

技术编号:45855432 阅读:16 留言:0更新日期:2025-07-19 11:14
本发明专利技术公开了一种查询变换器的训练方法,包括获取用于训练查询变换器的图片文本对;根据大语言模型生成对应的指令调优数据信息;将得到的指令调优数据信息输入到查询变换器,以实现对查询变换器的训练。本发明专利技术还公开了一种包括了所述查询变换器的训练方法的多模态大模型预训练方法,以及包括了所述多模态大模型预训练方法的电力系统变电站检修方法。本发明专利技术通过创新的茶轩变换器的训练过程,并将训练后的查询变换器引入多模态大模型并进行对应的预训练,不仅实现了查询变换器的训练和多模态大模型的预训练,而且本发明专利技术得到的查询变换器和预训练的多模态大模型的可靠性更高,精确性更好,效率也更高。

【技术实现步骤摘要】

本专利技术属于电力系统大模型领域,具体涉及一种查询变换器的训练方法、多模态大模型预训练方法及电力系统变电站检修方法


技术介绍

1、随着经济技术的发展和人们生活水平的提高,电能已经成为了人们生产和生活中必不可少的二次能源,给人们的生产和生活带来了无尽的便利。

2、现阶段,随着智能时代的到来,多模态大模型已经广泛应用于电力系统中,给电力系统的安全稳定运行带来了极大的保障。因此,保证电力系统中多模态大模型的稳定、可靠和快速运行,对于电力系统而言,具有重要意义。

3、目前,电力系统的多模态大模型,多采用metalm的方案,即将大语言模型作为一个统一的任务层,连接不同模态的编码器,通过自然语言表述各种任务,并使用语言指令的方式实现任务的切换,最后生成的文本作为任务的结果,只使用语言建模这一损失函数进行训练。同时,现阶段的电力系统多模态大模型,还采用q-former完成视觉特征的提取和压缩,减少视觉的token数量,同时保持视觉编码器和大语言模型冻结,只用训练参数量在百万级别的q-former即可。

4、但是,在现阶段,多模态大模本文档来自技高网...

【技术保护点】

1.一种查询变换器的训练方法,包括如下步骤:

2.根据权利要求1所述的查询变换器的训练方法,其特征在于步骤S2所述的基于步骤S1获取的图片文本对,根据大语言模型,生成对应的指令调优数据信息,具体包括如下步骤:

3.根据权利要求2所述的查询变换器的训练方法,其特征在于步骤S3所述的步骤S2得到的指令调优数据信息输入到查询变换器,以实现对查询变换器的训练,具体包括如下步骤:

4.一种包括了权利要求1~3之一所述的查询变换器的训练方法的多模态大模型预训练方法,其特征在于包括如下步骤:

5.根据权利要求4所述的多模态大模型预训练方法,其特征在于步骤...

【技术特征摘要】

1.一种查询变换器的训练方法,包括如下步骤:

2.根据权利要求1所述的查询变换器的训练方法,其特征在于步骤s2所述的基于步骤s1获取的图片文本对,根据大语言模型,生成对应的指令调优数据信息,具体包括如下步骤:

3.根据权利要求2所述的查询变换器的训练方法,其特征在于步骤s3所述的步骤s2得到的指令调优数据信息输入到查询变换器,以实现对查询变换器的训练,具体包括如下步骤:

4.一种包括了权利要求1~3之一所述的查询变换器的训练方法的多模态大模型预训练方法,其特征在于包括如下步骤:

5.根据权利要求...

【专利技术属性】
技术研发人员:陈毅波黄鑫李湘华林海田建伟张俊田峥周旭胡玉鹏祝视
申请(专利权)人:国网湖南省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1