辅助模型切分的方法、装置及可读存储介质制造方法及图纸

技术编号:37959912 阅读:19 留言:0更新日期:2023-06-30 09:34
本申请提供一种辅助模型切分的方法、装置及可读存储介质,该方法包括:网络实体接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息,第一消息中包括下述至少一项:待参与AI/ML模型切分的UE(s)或者用户永久标识SUPI、待使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小;网络实体根据第一消息进行分析,确定AI/ML模型切分的切分结果。本申请能够实现基于终端能力对模型切分进行分析,进而有效地实现对终端隐私的保护以及网络资源的优化本法。隐私的保护以及网络资源的优化本法。隐私的保护以及网络资源的优化本法。

【技术实现步骤摘要】
辅助模型切分的方法、装置及可读存储介质


[0001]本申请涉及通信
,尤其涉及一种辅助模型切分的方法、装置及可读存储介质。

技术介绍

[0002]近年来,由于人工智能的技术突破,人工智能的应用越来越广泛。对于移动终端,由于其具有严格的能耗、计算和内存成本限制,无法在终端运行重量级的人工智能(英文为:Artificial Intelligence,简称为:AI)/机器学习(英文为:Machine Learning,简称为:ML)模型(以下称为AI/ML模型),因此,目前采用的手段是将许多AI/ML模型的推理从移动终端传输到云或者其他终端,即需要把AI/ML模型传输给云或者其他终端。
[0003]此外,在SA#93e通过的SA1 R18需求中,需要AI/ML模型传输的场景如下:AI/ML端点之间的AI/ML模型切分,即一个AI/ML模型可以基于当前的任务或者环境切分成多个部分。趋势是将计算复杂,能耗大的部分由网络进行推理,需要隐私保护或者时延敏感的部分在终端推理。
[0004]但是,现有技术中,无法实现基于终端能力对模型切分的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种辅助模型切分的方法,其特征在于,应用于网络实体,所述方法包括:接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息;根据所述第一消息,确定AI/ML模型切分的切分结果。2.根据权利要求1所述的方法,其特征在于,所述第一消息中包括下述至少一项:待参与AI/ML模型切分的UE(s)或者用户永久标识SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述第一消息中还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一消息,确定AI/ML模型切分的切分结果,包括:根据所述第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量,确定所述待参与模型联合推理的UE(s)对应的模型切分点信息;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,则根据所述第一消息中的待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息,确定所述待参与模型联合推理的UE(s)对应的模型切分点信息;将所述模型切分点信息作为所述切分结果。4.根据权利要求3所述的方法,其特征在于,所述确定所述待参与模型联合推理的UE(s)对应的模型切分点信息,包括:将所有确定参与执行模型联合推理的UE(s)中的任一UE作为目标UE,针对每个所述目标UE执行下述步骤:若所述目标UE可提供的算力低于第一预设算力阈值或所述目标UE可提供的内存低于第一预设内存阈值或所述目标UE剩余的电量低于第一预设电量阈值时,确定所述目标UE执行第一预设数目层的推理;若所述目标UE可提供的算力高于第一预设算力阈值并低于第二预设算力阈值,和所述目标UE可提供的内存高于第一预设内存阈值并低于第二预设内存阈值,以及所述目标UE剩余的电量高于第一预设电量阈值并低于第二预设预设电量阈值时,确定所述目标UE执行第二预设数目的推理,第一预设数目层小于第二预设数目层;若所述目标UE可提供的算力高于第二预设算力阈值并低于第三预设算力阈值,和所述目标UE可提供的内存高于第二预设内存阈值并低于第三预设内存阈值,以及所述目标UE剩余的电量高于第二预设电量阈值并低于第三预设电量阈值时,确定所述目标UE执行第三预设数目层的推理,第二预设数目层小于第三预设数目层;以此类推,直至确定所述目标UE执行第N+1预设数目层的推理,第N预设数目层小于第N+1预设数目层;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,且若推理AI/ML模型需要的数据集的隐私等级低于第一预设隐私等级或模型不同层的时延需求信息低于第一预设时延,则所述目标UE执行所述第一预设数目层的推理;
若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,且若推理AI/ML模型需要的数据集的隐私等级高于第一预设隐私等级并低于第二预设隐私等级,和模型不同层的时延需求信息高于第一预设时延并低于第二预设时延时,确定所述目标UE执行第二预设数目层的推理;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,且若推理AI/ML模型需要的数据集的隐私等级高于第二预设隐私等级并低于第三预设隐私等级,和模型不同层的时延需求信息高于第二预设时延并低于第三预设时延时,确定所述目标UE执行第三预设数目层的推理;以此类推,直至确定所述目标UE执行第N+1预设数目层的推理,第N预设数目层小于第N+1预设数目层;根据预设数目层确定AI/ML模型切分点信息,所述AI/ML模型切分点信息用于表示AI/ML模型切分比例,所述预设数目层包括第N预设数目层,N大于或等于一。5.根据权利要求1

4任一项所述的方法,其特征在于,如果所述网络实体是网络数据分析功能NWDAF,所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息,包括:直接或通过网络能力开放功能NEF接收应用功能AF发送的第一请求,所述第一请求用于请求对AI/ML模型切分进行分析;其中,所述第一请求中携带的参数包括下述至少一项:与模型标识或模型切分标识关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量;若推理AI/ML模型需要数据集的隐私等级和/或模型不同层的时延,所述第一请求中携带的参数还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;根据所述第一请求中携带的参数,向5GC NF(s)发送第二消息,所述第二消息用于请求5GC NF(s)采集UE(s)对应的第一数据,所述第一数据中包括下述至少一项:待参与AI/ML模型切分的UE(s)以及SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小;若第一请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息,则所述第一数据中还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;接收5GC NF(s)发送的所述第一数据,并将所述第一数据作为所述第一消息;所述第一数据是由待参与模型联合推理的UE(s)同意所述第二消息的请求后提供的。6.根据权利要求5所述的方法,其特征在于,所述确定AI/ML模型切分的切分结果之后,所述方法还包括:向所述AF发送第三消息,所述第三消息中包括AI/ML模型切分点信息以及所述第一数据;所述第三消息用于为AF提供向待参与模型联合推理的UE(s)发送第二请求时携带的参数,所述第二请求用于请求与待参与模型联合推理的UE(s)执行模型联合推理操作,所述第二请求中携带的参数包括所述第三消息。7.根据权利要求1

4任一项所述的方法,其特征在于,如果所述网络实体是网络数据分析功能NWDAF,所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息,包
括:直接或通过网络能力开放功能NEF接收AF发送的第三请求;所述第三请求是由AF确定与待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力后确定的,其中,是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第四请求中携带的参数确定的,所述第四请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理,所述第四请求中携带的参数包括下述至少一项:与模型标识或模型切分标识关联的分析类型标识、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述第四请求中携带的参数还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息,所述第三请求中携带的参数包括所述第四请求中携带的参数;将所述第三请求中携带的参数作为所述第一消息;其中,若第四请求中携带的参数中不包含模型不同层的时延需求信息,则模型不同层的时延需求信息由AF提供。8.根据权利要求7所述的方法,其特征在于,所述确定AI/ML模型切分的切分结果之后,所述方法还包括:向所述AF发送第四消息,所述第四消息中包括所述AI/ML模型切分点信息、所述第一消息中的数据;所述第四消息用于为AF提供向待参与模型联合推理的UE(s)发送的第四请求结果,所述第四请求结果中包括所述AI/ML模型切分点信息。9.根据权利要求1

4任一项所述的方法,其特征在于,如果所述网络实体是网络数据分析功能NWDAF,所述接收用于请求人工智能/机器学习AI/ML模型切分分析的第一消息,包括:直接或通过网络能力开放功能NEF接收应用功能AF发送的第五请求,所述第五请求是由AF确定与待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力后确定的,其中,是否具备完全支持执行模型联合推理的能力是由AF根据接收到的待参与模型联合推理的UE(s)发送的第六请求确定的,所述第五请求用于请求对AI/ML模型切分进行分析以及请求查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量;其中,所述第五请求中携带的参数包括下述至少一项:与模型切分关联的分析类型标识、接受AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足切分条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述第五请求中携带的参数还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;所述第六请求用于待参与模型联合推理的UE(s)请求与AF进行模型联合推理,所述第六请求中携带的参数包括所述第五请求中携带的参数;根据所述第五请求中携带的参数,向5GC NF(s)发送第五消息,所述第五消息用于请求5GC NF(s)采集UE(s)对应的第二数据,所述第二数据中包括下述至少一项:待参与AI/ML模型切分的UE(s)或者SUPI、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量、AI/ML模型的大小;若
第五请求中携带的参数包括推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息,则所述第二数据中还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;接收5GC NF(s)发送的所述第二数据,并将所述第二数据作为所述第一消息;所述第二数据是由待参与模型联合推理的UE(s)同意所述第五消息的请求后提供的;其中,若第六请求中携带的参数中不包含模型不同层的时延需求信息,则模型不同层的时延需求信息由AF提供。10.根据权利要求9所述的方法,其特征在于,所述确定AI/ML模型切分的切分结果之后,所述方法还包括:向所述AF发送第六消息,所述第六消息中至少包括所述AI/ML模型切分点信息以及所述第二数据;所述第六消息用于为AF提供向待参与模型联合推理的UE(s)发送的第六请求结果,所述第六请求结果中包括所述待参与模型联合推理的UE(s)以及对应的所述AI/ML模型切分点信息。11.根据权利要求1

4任一项所述的方法,其特征在于,如果所述网络实体是网络数据分析功能NWDAF,所述接收用于请求人工智能/机器学习AI/ML模型切分分析的第一消息,包括:接收待参与模型联合推理的UE(s)发送的第七请求,所述第七请求用于请求与NWDAF执行模型联合推理操作;所述第七请求中携带的参数包括下述至少一项:待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述第七请求中携带的参数还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;根据所述第七请求中携带的参数,确定AF与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力;若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力,则将所述第七请求中携带的参数作为所述第一消息;若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力,则请求NF查找其他可参与模型推理的UE(s)并提供其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量,且若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,则请求提供其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;接收NF发送的查找结果,所述查找结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量,若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,则查找结果还包括:其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;将所述第七请求中携带的参数以及所述查找结果作为所述第一消息;其中,若第七请求中携带的参数中不包含模型不同层的时延需求信息,则模型不同层的时延需求信息由AF提供。12.根据权利要求11所述的方法,其特征在于,所述确定AI/ML模型切分的切分结果之后,所述方法还包括:
向所述待参与模型联合推理的UE(s)发送第七请求结果,所述第七请求结果中包括AI/ML模型切分点信息;其中,若存在其他参与联合模型推理的UE(s),则所述第七请求结果中还包括其他参与联合模型推理的UE(s)对应的模型切分点信息,并通过AF透传给所述UE(s)。13.根据权利要求1

4任一项所述的方法,其特征在于,如果所述网络实体是应用功能AF,所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息,包括:接收待参与模型联合推理的UE(s)发送的第八请求,所述第八请求用于请求与AF执行模型联合推理操作;所述第八请求中携带的参数包括下述至少一项:与模型标识或模型切分标识关联的分析类型标识、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述第八请求中携带的参数还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;根据所述第八请求中携带的参数,确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力;若与所述待参与模型联合推理的UE(s)具备完全支持执行模型联合推理的能力,则将所述第八请求中携带的参数作为所述第一消息;若与所述待参与模型联合推理的UE(s)不具备完全支持执行模型联合推理的能力,则向网络数据分析功能NWDAF发送第九请求,所述第九请求中携带的参数包括所述第八请求中携带的参数,且所述第九请求用于请求NWDAF通过NF查找其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量,若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述第九请求中携带的参数还包括:其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;接收NWDAF发送的第九请求结果,并将所述第九请求结果以及所述第八请求中携带的参数作为所述第一消息;其中,所述第九请求结果包括其他可参与模型推理的UE(s)以及其他可参与模型推理的UE(s)可提供的算力、可提供的内存、剩余的电量,若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述第九请求结果还包括:其他可参与模型推理的UE(s)推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;若第八请求中携带的参数中不包含模型不同层的时延需求信息,则模型不同层的时延需求信息由AF提供。14.根据权利要求13所述的方法,其特征在于,所述确定AI/ML模型切分的切分结果之后,所述方法还包括:将确定与所述待参与模型联合推理的UE(s)是否具备完全支持执行模型联合推理的能力的结果、所述待参与模型联合推理的UE(s)的相关信息以及所述待参与模型联合推理的UE(s)对应的模型切分点信息发送给所述UE;其中,所述相关信息包括下述至少一项:待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述相关信息中还包
括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息。15.根据权利要求1

4任一项所述的方法,其特征在于,如果所述网络实体是应用功能AF,所述接收用于辅助人工智能/机器学习AI/ML模型切分分析的第一消息,包括:向网络数据分析功能NWDAF发送第十请求,所述第十请求用于请求NWDAF向5GC NF(s)采集UE(s)对应的用于分析AI/ML模型切分的数据,所述第十请求中携带的参数包括下述至少一项:与模型标识或模型切分标识关联的分析类型标识、接收AI/ML模型切分的一个用户设备UE或一组UEs的标识或满足分析条件的任意UEs、AI/ML模型切分的区域、AI/ML模型的大小、待参与模型联合推理的UE(s)可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余的电量;若推理AI/ML模型时需要数据集的隐私等级和/或模型不同层的时延,所述第十请求中携带的参数还包括:推理AI/ML模型需要的数据集的隐私等级和/或模型不同层的时延需求信息;接收NWDAF发送的第十请求结果,所述第十请求结果包括下述至少一项:待参与AI/ML模型切分的UE(s)或者SUPI、使用AI/ML模型的应用的标识、待参与模型联合推理的UE可提供的算力、待参与模型联合推理的UE(s)可提供的内存、待参与模型联合推理的UE(s)剩余...

【专利技术属性】
技术研发人员:刘莹莹段小嫣
申请(专利权)人:大唐移动通信设备有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1