用于适应性地流传输人工智能模型文件的方法和系统技术方案

技术编号:41770969 阅读:17 留言:0更新日期:2024-06-21 21:47
提供了一种用于适应性地流传输人工智能(AI)模型文件的方法,其包括:确定第一电子设备的能力和第二电子设备的能力、与第一电子设备和第二电子设备相关联的网络信息、以及与AI模型文件相关联的AI模型信息;基于所确定的能力和信息来确定适应性地流传输AI模型文件;预处理AI模型文件;以及适应性地流传输AI模型。

【技术实现步骤摘要】
【国外来华专利技术】

本公开涉及用于适应性地流传输人工智能模型文件的方法和系统


技术介绍

1、基于人工智能(ai)/机器学习(ml)的移动设备应用是计算密集的、存储器密集的和功率密集的。移动设备(例如,智能电话)通常具有严格的的能耗以及在板上运行离线ai/ml推理的计算要求。许多基于ai/ml的移动设备应用(诸如图像/视频识别)将推理处理从移动设备卸载到互联网数据中心(idc)。例如,在被显示给用户之前,用移动设备拍摄的照片频繁地在基于云的ai/ml模型和/或预加载的ai/ml模型中进行处理。然而,基于云的ai/ml推理任务必须考虑idc计算压力和所需的数据速率/延时。

2、卷积神经网络(cnn)模型已经在移动设备上用于图像/视频识别任务,诸如图像分类、图像拆分、对象定位、对象检测、面部认证、动作识别、增强摄影、虚拟现实(vr)/增强现实(ar)和视频游戏。然而,cnn模型推理需要相当大量的计算和存储空间。

3、由于移动设备上有限的存储,预加载所有可能的ai/ml模型(卸载ai/ml推理)是不切实际的,并且需要ai/ml模型下载和/或迁移学习。然而,下本文档来自技高网...

【技术保护点】

1.一种用于将人工智能(AI)模型文件从第一电子设备适应性地流传输到第二电子设备的方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述第一电子设备的能力和所述第二电子设备的能力基于所述第一电子设备或所述第二电子设备的处理器、存储器、电池状态和设备健康状况中的至少之一来确定。

3.根据权利要求1所述的方法,其中,所述第一电子设备的能力或所述第二电子设备的能力指示以下至少之一:至少一个部分AI模型的处理时间、所述至少一个部分AI模型的运行时间、所述至少一个部分AI模型的推理时间、所述至少一个部分AI模型的拆分时间和所述至少一个部分AI模型的传送时间。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于将人工智能(ai)模型文件从第一电子设备适应性地流传输到第二电子设备的方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述第一电子设备的能力和所述第二电子设备的能力基于所述第一电子设备或所述第二电子设备的处理器、存储器、电池状态和设备健康状况中的至少之一来确定。

3.根据权利要求1所述的方法,其中,所述第一电子设备的能力或所述第二电子设备的能力指示以下至少之一:至少一个部分ai模型的处理时间、所述至少一个部分ai模型的运行时间、所述至少一个部分ai模型的推理时间、所述至少一个部分ai模型的拆分时间和所述至少一个部分ai模型的传送时间。

4.根据权利要求1所述的方法,其中,所述网络信息包括网络类型、带宽信息、延时信息、切换信息、移动性信息、下载链路信息、上行链路信息、数据传输速度、在所述第一电子设备和所述第二电子设备之间的数据传送的类型、以及在所述第一电子设备和所述第二电子设备之间的数据传送的大小。

5.根据权利要求1所述的方法,其中,所述ai模型信息包括ai架构的类型、在ai架构的所述类型中使用的数据的类型、在所述ai架构中使用的链路的类型和在所述ai架构中的跨层依赖性。

6.根据权利要求1所述的方法,其中,所述预处理指示以下至少之一:在所述第一电子设...

【专利技术属性】
技术研发人员:P·查克拉博蒂N·R·瑟拉帕蒂斯里尼迪·NE·H·C·伊普J·卡尔吉J·凯恩斯R·B·文卡特达比鲁
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1