模型微调的方法、装置及设备制造方法及图纸

技术编号:39251482 阅读:6 留言:0更新日期:2023-10-30 12:03
本申请公开了一种模型微调的方法、装置及设备,属于通信技术领域,本申请实施例的模型微调的方法包括:第一设备获取第一目标信息,其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息;所述第一设备根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调。行微调。行微调。

【技术实现步骤摘要】
模型微调的方法、装置及设备


[0001]本申请属于通信
,具体涉及一种模型微调的方法、装置及设备。

技术介绍

[0002]随着人工智能(Artificial Intelligence,AI)的快速发展,其已在各个领域得到了广泛的应用。例如,对于通信领域,AI模块(如AI模型等)可部署在终端侧或网络侧,以进行波束信息预测等。
[0003]目前,在相关技术中,终端或网络侧设备通常可采用迁移学习的方式来进行模型训练,但在前述迁移学习过程中,依旧存在模型训练效果不佳等问题,影响通信性能。

技术实现思路

[0004]本申请实施例提供一种模型微调的方法、装置及设备,能够提升模型训练效果,以确保通信性能。
[0005]第一方面,提供了一种模型微调的方法,所述方法包括:第一设备获取第一目标信息,其中,所述第一目标信息包括第一信息和/或第二信息中的至少一项,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息;所述第一设备根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调。
[0006]第二方面,提供了一种模型微调的方法,包括:第二设备向第一设备发送第一目标信息;其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息。
[0007]第三方面,提供了一种模型微调的装置,应用于第一设备,所述装置包括:第一获取模块,用于获取第一目标信息,其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息;微调模块,用于根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调。
[0008]第四方面,提供了一种模型微调的装置,包括:第二发送模块,用于向第一设备发送第一目标信息;其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息。
[0009]第五方面,提供了一种设备,该设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤,或实现如第二方面所述的方法的步骤。
[0010]第六方面,提供了一种终端,包括处理器及通信接口,其中,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法的步骤,或实现如第二方面所述的方法的步骤。
[0011]第七方面,提供了一种模型微调的系统,包括:第一设备及第二设备,所述终端可
用于执行如第一方面所述的模型微调的方法的步骤,所述第二设备可用于执行如第二方面所述的模型微调的方法的步骤。
[0012]第八方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤,或者实现如第二方面所述的方法的步骤。
[0013]第九方面,提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法的步骤,或实现如第二方面所述的方法的步骤。
[0014]第十方面,提供了一种计算机程序产品/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的方法的步骤,或实现如第二方面所述的方法的步骤。
[0015]在本申请实施例中,通过第一目标信息(如第一AI模型的微调配置相关信息、所述第一AI模型的微调模式信息)的迁移,使得第一设备能够基于第一目标信息进行第一AI模型的训练(或微调、校验等),能够提高第一设备上的AI模型训练(或微调、校验等)效果,确保通信性能。
附图说明
[0016]图1是本申请一示例性实施例提供的无线通信系统的结构示意图。
[0017]图2是本申请一示例性实施例提供的模型微调的方法的流程示意图。
[0018]图3是本申请另一示例性实施例提供的模型微调的方法的流程示意图。
[0019]图4是本申请又一示例性实施例提供的模型微调的方法的流程示意图。
[0020]图5是本申请一示例性实施例提供的模型微调的装置的结构示意图。
[0021]图6是本申请另一示例性实施例提供的模型微调的装置的结构示意图。
[0022]图7是本申请一示例性实施例提供的设备的结构示意图。
[0023]图8是本申请一示例性实施例提供的终端的结构示意图。
[0024]图9是本申请一示例性实施例提供的网络侧设备的结构示意图。
具体实施方式
[0025]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
[0026]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
[0027]值得指出的是,本申请实施例所描述的技术不限于长期演进型(Long Term Evolution,LTE)/LTE的演进(LTE

Advanced,LTE

A)系统,还可用于其他无线通信系统,诸
如码分多址(Code Division Multiple Access,CDMA)、时分多址(Time Division Multiple Access,TDMA)、频分多址(Frequency Division Multiple Access,FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access,OFDMA)、单载波频分多址(Single

carrier Frequency

Division Multiple Access,SC

FDMA)和其他系统。本申请实施例中的术语“系统”和“网络”常被可互换地使用,所描述的技术既可用于以上提及的系统和无线电技术,也可用于其他系统和无线电技术。以下描述出于示例目的描述了新空口(New Radio,NR)系统,并且在以下大部分描述中使用NR术语,但是这些技术也可应用于NR系统应用以外的应用,如第5.5代(5.5th本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型微调的方法,其特征在于,所述方法包括:第一设备获取第一目标信息,其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息;所述第一设备根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调。2.如权利要求1所述的方法,其特征在于,所述第一AI模型为以下任一项:预配置在所述第一设备上的模型;预配置在第二设备上的模型;经第二设备训练得到的模型;经第二设备转发的模型;其中,所述第二设备为向所述第一设备发送所述第一目标信息的设备。3.如权利要求1或2所述的方法,其特征在于,所述第一目标信息还包括第三信息,所述第三信息至少包括所述第一AI模型的信息。4.如权利要求1

3中任一项所述的方法,其特征在于,所述第一AI模型的微调配置相关信息包括以下至少一项:第一层的数量,所述第一层是所述第一AI模型中不需要进行参数微调的层;第二层的数量,所述第二层是所述第一AI模型中需要进行参数微调的层;所述第一层的索引;所述第二层的索引;微调数据量,所述微调数据量是所述第一AI模型进行微调时所需的数据量;目标批数,所述目标批数是所述第一AI模型进行微调时所需的微调数据的批数;批的大小,所述批的大小是所述第一AI模型进行微调时所需的每批微调数据的数据量大小;模型迭代次数,所述模型迭代次数是对所述第一AI模型进行一次微调时所需要达到的总迭代次数;目标性能,所述目标性能是对所述第一AI模型进行微调时所要达到的模型性能;微调学习率;微调学习率变化策略。5.如权利要求1

4中任一项所述的方法,其特征在于,所述第一AI模型的微调模式信息包括以下至少一项:单次微调模式;周期性微调模式;所述周期性微调模式对应的微调周期;事件触发性微调模式;所述事件触发性微调模式对应的触发事件信息。6.如权利要求1

5中任一项所述的方法,其特征在于,所述方法还包括:所述第一设备基于第一数据集运行所述第一AI模型,得到第一性能信息;在根据所述第一性能信息确定需要对所述第一AI模型进行微调的情况下,所述第一设备执行根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调的步骤。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:在根据所述第一性能信息确定不需要对所述第一AI模型进行微调的情况下,所述第一设备基于所述第一AI模型进行模型推理过程。8.如权利要求6或7所述的方法,其特征在于,根据所述第一性能信息确定需要对所述第一AI模型进行微调,包括:在所述第一性能信息满足第一条件的情况下,确定需要对所述第一AI模型进行微调;其中,所述第一条件包括以下至少一项:所述第一性能信息大于或等于第一门限值;所述第一性能信息小于或等于第二门限值;在第一时间段内,所述第一性能信息大于或等于第一门限的次数达到第三门限值;在第二时间段内,所述第一性能信息小于或等于第二门限的次数达到第四门限值;所述第一性能信息大于或等于第一门限值的持续时间达到第五门限值;所述第一性能信息小于或等于第二门限值的持续时间达到第六门限值。9.如权利要求1

8中任一项所述的方法,其特征在于,根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调的步骤之前,所述方法还包括:在所述第一目标信息中未包括所述第一信息的情况下,所述第一设备向所述第二设备发送第一请求,所述第一请求用于向所述第二设备请求所述第一信息;所述第一设备接收所述第二设备发送的第一信息。10.如权利要求2

9中任一项所述的方法,其特征在于,所述方法还包括:在第二AI模型的模型性能信息满足第二条件的情况下,所述第一设备根据第三数据集、所述第一信息以及所述第二信息中的至少一项对所述第二AI模型进行微调;其中,所述第二条件根据所述第一AI模型的微调模式信息中除单次微调模式之外的其他信息中的至少一项确定,所述第二AI模型是所述第一AI模型经过至少一次模型微调后得到的模型,或者,所述第二AI模型是正在进行模型推理过程或已经完成至少一次模型推理过程的所述第一AI模型。11.如权利要求6

10中任一项所述的方法,其特征在于,所述方法还包括:所述第一设备向第二设备或第三设备发送第二目标信息;其中,所述第二设备为向所述第一设备发送所述第一目标信息的设备,所述第三设备为所述第一AI模型的监控或维护设备,所述第二目标信息包括以下至少一项:第一性能信息,所述第一性能信息是所述第一AI模型的模型性能信息;第二性能信息,所述第二性能信息是第二AI模型的模型性能信息;第一指示信息,所述第一指示信息用于指示所述第一设备已经完成了对所述第二AI模型的微调;第二指示信息,所述第二指示信息用于指示所述第一设备已经基于所述第二AI模型进行模型推理过程;其中,所述第二AI模型是所述第一AI模型经过至少一次模型微调后得到的模型,或者,所述第二AI模型是正在进行模型推理过程或已经完成至少一次模型推理过程的所述第一AI模型。12.一种模型微调的方法,其特征在于,包括:
第二设备向第一设备发送第一目标信息;其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息。13.如权利要求12所述的方法,其特征在于,所述第一AI模型为以下任一项:预配置在所述第二设备上的模型;预配置在所述第一设备上的模型;经所述第二设备训练得到的模型;经所述第二设备转发的模型。14.如权利要求12或13所述的方法,其特征在于,所述第一目标信息还包括第三信息,所述第三信息至少包括第一AI模型的信息。15.如权利要求12

14中任一项所述的方法,其特征在于,所述第一AI模型的微调配置相关信息包括以下至少一项:第一层的数量,所述第一层是所述第一AI模型中不需要进行参数微调的层;第二层的数量,所述第二层是所述第一AI模型中需要进行参数微调的层;所述第一层的索引;所述第二层的索引;微调数据量,所述微调数据量是所述第一AI模型进行微调时所需的数据量;目标批数,所述目标批数是所述第一AI模型进行微调时所需的微调数据的批数;批的大小,所述批的大小是所述第一AI模型进行微调时所需的每批微调数据的数据量大小;模型迭代次数,所述模型迭代次数是对所述第一AI模型进行一次微调时所需要达到的总迭代次数;目标性能,所述目标性能是对所述第一AI模型进行微调时所要达到的模型性能;微调学习率;微调学习率变化策略。16.如权利要求12

15中任一项所述的方法,其特征在于,所述第一AI模型的微调模式信息包括以下至少一项:单次微调模式;周期性微调模式;所述周期性微调模式对应的微调周期;事件触发性微调模式;所述事件触发性微调模式对应的触发事件信息。17.如权利要求12

16中任一项所述的方法,其特征在于,所述方法还包括:所述第二设备接收所述第一设备发送的第一请求;所述第二设备根据所述第一请求向所述第一设备发送所述第一信息。18.如权利要求12

17中任一项所述的方法,其特征在于,所述方法还包括:所述第二设备接收所述第一设备发送的第二目标信息;其中,所述第二目标信息包括以下至少一项:第一性能信息,所述第一性能信息是所述第一AI模型的模型性能信息;
第二性能信息,所述第二性能信息是第二AI模型的模型性能信息;第一指示信息,所述第一指示信息用于指示所述第一设备已经完成了对第二AI模型的微调;第二指示信息,所述第二指示信息用于指示所述第一设备已经基于第二AI模型进行模型推理过程;其中,所述第二AI模型是所述第一AI模型经过至少一次模型微调后得到的模型,或者,所述第二AI模型是正在进行模型推理过程或已经完成至少一次模型推理过程的所述第一AI模型。19.一种模型微调的装置,其特征在于,应用于第一设备,所述装置包括:第一获取模块,用于获取第一目标信息,其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模...

【专利技术属性】
技术研发人员:孙布勒杨昂孙鹏
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1