【技术实现步骤摘要】
本专利技术属于电力系统大模型领域,具体涉及一种查询变换器的训练方法、多模态大模型预训练方法及电力系统变电站检修方法。
技术介绍
1、随着经济技术的发展和人们生活水平的提高,电能已经成为了人们生产和生活中必不可少的二次能源,给人们的生产和生活带来了无尽的便利。
2、现阶段,随着智能时代的到来,多模态大模型已经广泛应用于电力系统中,给电力系统的安全稳定运行带来了极大的保障。因此,保证电力系统中多模态大模型的稳定、可靠和快速运行,对于电力系统而言,具有重要意义。
3、目前,电力系统的多模态大模型,多采用metalm的方案,即将大语言模型作为一个统一的任务层,连接不同模态的编码器,通过自然语言表述各种任务,并使用语言指令的方式实现任务的切换,最后生成的文本作为任务的结果,只使用语言建模这一损失函数进行训练。同时,现阶段的电力系统多模态大模型,还采用q-former完成视觉特征的提取和压缩,减少视觉的token数量,同时保持视觉编码器和大语言模型冻结,只用训练参数量在百万级别的q-former即可。
4、但是,
...【技术保护点】
1.一种查询变换器的训练方法,包括如下步骤:
2.根据权利要求1所述的查询变换器的训练方法,其特征在于步骤S2所述的基于步骤S1获取的图片文本对,根据大语言模型,生成对应的指令调优数据信息,具体包括如下步骤:
3.根据权利要求2所述的查询变换器的训练方法,其特征在于步骤S3所述的步骤S2得到的指令调优数据信息输入到查询变换器,以实现对查询变换器的训练,具体包括如下步骤:
4.一种包括了权利要求1~3之一所述的查询变换器的训练方法的多模态大模型预训练方法,其特征在于包括如下步骤:
5.根据权利要求4所述的多模态大模型预训练
...【技术特征摘要】
1.一种查询变换器的训练方法,包括如下步骤:
2.根据权利要求1所述的查询变换器的训练方法,其特征在于步骤s2所述的基于步骤s1获取的图片文本对,根据大语言模型,生成对应的指令调优数据信息,具体包括如下步骤:
3.根据权利要求2所述的查询变换器的训练方法,其特征在于步骤s3所述的步骤s2得到的指令调优数据信息输入到查询变换器,以实现对查询变换器的训练,具体包括如下步骤:
4.一种包括了权利要求1~3之一所述的查询变换器的训练方法的多模态大模型预训练方法,其特征在于包括如下步骤:
5.根据权利要求...
【专利技术属性】
技术研发人员:陈毅波,黄鑫,李湘华,林海,田建伟,张俊,田峥,周旭,胡玉鹏,祝视,
申请(专利权)人:国网湖南省电力有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。