【技术实现步骤摘要】
模型微调的方法、装置及设备
[0001]本申请属于通信
,具体涉及一种模型微调的方法、装置及设备。
技术介绍
[0002]随着人工智能(Artificial Intelligence,AI)的快速发展,其已在各个领域得到了广泛的应用。例如,对于通信领域,AI模块(如AI模型等)可部署在终端侧或网络侧,以进行波束信息预测等。
[0003]目前,在相关技术中,终端或网络侧设备通常可采用迁移学习的方式来进行模型训练,但在前述迁移学习过程中,依旧存在模型训练效果不佳等问题,影响通信性能。
技术实现思路
[0004]本申请实施例提供一种模型微调的方法、装置及设备,能够提升模型训练效果,以确保通信性能。
[0005]第一方面,提供了一种模型微调的方法,所述方法包括:第一设备获取第一目标信息,其中,所述第一目标信息包括第一信息和/或第二信息中的至少一项,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息;所述第一设备根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调。
[0006]第二方面,提供了一种模型微调的方法,包括:第二设备向第一设备发送第一目标信息;其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息。
[0007]第三方面,提供了一种模型微调的装置,应用于第一设备,所述装置包括:第一获取模块,用于获取第一目标信息,其 ...
【技术保护点】
【技术特征摘要】
1.一种模型微调的方法,其特征在于,所述方法包括:第一设备获取第一目标信息,其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息;所述第一设备根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调。2.如权利要求1所述的方法,其特征在于,所述第一AI模型为以下任一项:预配置在所述第一设备上的模型;预配置在第二设备上的模型;经第二设备训练得到的模型;经第二设备转发的模型;其中,所述第二设备为向所述第一设备发送所述第一目标信息的设备。3.如权利要求1或2所述的方法,其特征在于,所述第一目标信息还包括第三信息,所述第三信息至少包括所述第一AI模型的信息。4.如权利要求1
‑
3中任一项所述的方法,其特征在于,所述第一AI模型的微调配置相关信息包括以下至少一项:第一层的数量,所述第一层是所述第一AI模型中不需要进行参数微调的层;第二层的数量,所述第二层是所述第一AI模型中需要进行参数微调的层;所述第一层的索引;所述第二层的索引;微调数据量,所述微调数据量是所述第一AI模型进行微调时所需的数据量;目标批数,所述目标批数是所述第一AI模型进行微调时所需的微调数据的批数;批的大小,所述批的大小是所述第一AI模型进行微调时所需的每批微调数据的数据量大小;模型迭代次数,所述模型迭代次数是对所述第一AI模型进行一次微调时所需要达到的总迭代次数;目标性能,所述目标性能是对所述第一AI模型进行微调时所要达到的模型性能;微调学习率;微调学习率变化策略。5.如权利要求1
‑
4中任一项所述的方法,其特征在于,所述第一AI模型的微调模式信息包括以下至少一项:单次微调模式;周期性微调模式;所述周期性微调模式对应的微调周期;事件触发性微调模式;所述事件触发性微调模式对应的触发事件信息。6.如权利要求1
‑
5中任一项所述的方法,其特征在于,所述方法还包括:所述第一设备基于第一数据集运行所述第一AI模型,得到第一性能信息;在根据所述第一性能信息确定需要对所述第一AI模型进行微调的情况下,所述第一设备执行根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调的步骤。
7.如权利要求6所述的方法,其特征在于,所述方法还包括:在根据所述第一性能信息确定不需要对所述第一AI模型进行微调的情况下,所述第一设备基于所述第一AI模型进行模型推理过程。8.如权利要求6或7所述的方法,其特征在于,根据所述第一性能信息确定需要对所述第一AI模型进行微调,包括:在所述第一性能信息满足第一条件的情况下,确定需要对所述第一AI模型进行微调;其中,所述第一条件包括以下至少一项:所述第一性能信息大于或等于第一门限值;所述第一性能信息小于或等于第二门限值;在第一时间段内,所述第一性能信息大于或等于第一门限的次数达到第三门限值;在第二时间段内,所述第一性能信息小于或等于第二门限的次数达到第四门限值;所述第一性能信息大于或等于第一门限值的持续时间达到第五门限值;所述第一性能信息小于或等于第二门限值的持续时间达到第六门限值。9.如权利要求1
‑
8中任一项所述的方法,其特征在于,根据所述第一信息和/或所述第二信息对所述第一AI模型进行微调的步骤之前,所述方法还包括:在所述第一目标信息中未包括所述第一信息的情况下,所述第一设备向所述第二设备发送第一请求,所述第一请求用于向所述第二设备请求所述第一信息;所述第一设备接收所述第二设备发送的第一信息。10.如权利要求2
‑
9中任一项所述的方法,其特征在于,所述方法还包括:在第二AI模型的模型性能信息满足第二条件的情况下,所述第一设备根据第三数据集、所述第一信息以及所述第二信息中的至少一项对所述第二AI模型进行微调;其中,所述第二条件根据所述第一AI模型的微调模式信息中除单次微调模式之外的其他信息中的至少一项确定,所述第二AI模型是所述第一AI模型经过至少一次模型微调后得到的模型,或者,所述第二AI模型是正在进行模型推理过程或已经完成至少一次模型推理过程的所述第一AI模型。11.如权利要求6
‑
10中任一项所述的方法,其特征在于,所述方法还包括:所述第一设备向第二设备或第三设备发送第二目标信息;其中,所述第二设备为向所述第一设备发送所述第一目标信息的设备,所述第三设备为所述第一AI模型的监控或维护设备,所述第二目标信息包括以下至少一项:第一性能信息,所述第一性能信息是所述第一AI模型的模型性能信息;第二性能信息,所述第二性能信息是第二AI模型的模型性能信息;第一指示信息,所述第一指示信息用于指示所述第一设备已经完成了对所述第二AI模型的微调;第二指示信息,所述第二指示信息用于指示所述第一设备已经基于所述第二AI模型进行模型推理过程;其中,所述第二AI模型是所述第一AI模型经过至少一次模型微调后得到的模型,或者,所述第二AI模型是正在进行模型推理过程或已经完成至少一次模型推理过程的所述第一AI模型。12.一种模型微调的方法,其特征在于,包括:
第二设备向第一设备发送第一目标信息;其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模式信息。13.如权利要求12所述的方法,其特征在于,所述第一AI模型为以下任一项:预配置在所述第二设备上的模型;预配置在所述第一设备上的模型;经所述第二设备训练得到的模型;经所述第二设备转发的模型。14.如权利要求12或13所述的方法,其特征在于,所述第一目标信息还包括第三信息,所述第三信息至少包括第一AI模型的信息。15.如权利要求12
‑
14中任一项所述的方法,其特征在于,所述第一AI模型的微调配置相关信息包括以下至少一项:第一层的数量,所述第一层是所述第一AI模型中不需要进行参数微调的层;第二层的数量,所述第二层是所述第一AI模型中需要进行参数微调的层;所述第一层的索引;所述第二层的索引;微调数据量,所述微调数据量是所述第一AI模型进行微调时所需的数据量;目标批数,所述目标批数是所述第一AI模型进行微调时所需的微调数据的批数;批的大小,所述批的大小是所述第一AI模型进行微调时所需的每批微调数据的数据量大小;模型迭代次数,所述模型迭代次数是对所述第一AI模型进行一次微调时所需要达到的总迭代次数;目标性能,所述目标性能是对所述第一AI模型进行微调时所要达到的模型性能;微调学习率;微调学习率变化策略。16.如权利要求12
‑
15中任一项所述的方法,其特征在于,所述第一AI模型的微调模式信息包括以下至少一项:单次微调模式;周期性微调模式;所述周期性微调模式对应的微调周期;事件触发性微调模式;所述事件触发性微调模式对应的触发事件信息。17.如权利要求12
‑
16中任一项所述的方法,其特征在于,所述方法还包括:所述第二设备接收所述第一设备发送的第一请求;所述第二设备根据所述第一请求向所述第一设备发送所述第一信息。18.如权利要求12
‑
17中任一项所述的方法,其特征在于,所述方法还包括:所述第二设备接收所述第一设备发送的第二目标信息;其中,所述第二目标信息包括以下至少一项:第一性能信息,所述第一性能信息是所述第一AI模型的模型性能信息;
第二性能信息,所述第二性能信息是第二AI模型的模型性能信息;第一指示信息,所述第一指示信息用于指示所述第一设备已经完成了对第二AI模型的微调;第二指示信息,所述第二指示信息用于指示所述第一设备已经基于第二AI模型进行模型推理过程;其中,所述第二AI模型是所述第一AI模型经过至少一次模型微调后得到的模型,或者,所述第二AI模型是正在进行模型推理过程或已经完成至少一次模型推理过程的所述第一AI模型。19.一种模型微调的装置,其特征在于,应用于第一设备,所述装置包括:第一获取模块,用于获取第一目标信息,其中,所述第一目标信息包括第一信息和/或第二信息,所述第一信息至少包括第一AI模型的微调配置相关信息,所述第二信息至少包括第一AI模型的微调模...
【专利技术属性】
技术研发人员:孙布勒,杨昂,孙鹏,
申请(专利权)人:维沃移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。