一种面向微控制器平台的深度学习模型情境自适应压缩方法技术

技术编号：37672626 阅读：15 留言：0更新日期：2023-05-26 04:35

本发明专利技术涉及一种面向微控制器平台的深度学习模型情境自适应压缩方法，首先，基于轻量化压缩结构块装载和电压频率调整设计，搭建起深度学习模型及其所处智能应用的结构压缩和运行模式的自适应联合策略空间。接着，感知微控制器动态情境上下文——包括用户情境和资源情境。最终，在策略搜索空间内利用带约束多目标优化思想求解方案，对深度学习模型及其所处智能应用进行情境自适应的结构压缩和运行调优。本发明专利技术方法将感知动态情境上下文，并利用轻量化压缩结构块装载和电压频率调整，联合生成对应情境下深度学习模型及其所处智能应用的压缩和运行方案，增效模型于微控制器的部署和动态自适应能力。署和动态自适应能力。署和动态自适应能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向微控制器平台的深度学习模型情境自适应压缩方法

[0001]本专利技术为一种面向微控制器平台的深度学习模型情境自适应压缩方法，涉及到深度学习模型及其所处智能应用的情境自适应结构压缩和运行调优领域。

技术介绍

[0002]近些年，深度学习模型逐渐在众多人工智能领域(例如语音识别、计算机视觉、自然语言处理)大发异彩，同时其时间、空间复杂度更呈现爆炸式增长，增加了其于资源受限的移动或嵌入式边端平台的部署难度。在追求普适计算的时代背景下，微控制器(或单片机)以其小体积、低成本、低能耗和高集成度等优势成为未来智能应用极为关键的部署平台之一。但相比智能手机等移动设备，微控制器以其极端受限的存储和计算资源限制(例如主流的STM32系列往往只具备<1MB的运行内存SRAM和<2MB的持久性存储Flash)，更大程度地增加了模型部署的难度。此外，除资源条件限制这一挑战外，深度学习模型及其所处智能应用始终处于动态的用户情境(精度、时延、能耗需求等)和资源情境(电量、存储空间等)中。但传统模型往往基于某种特定数据集和固定的拓扑结构训练生成，缺乏一定的动态机制，对情境的自适应能力差。
[0003]已有技术中，一系列资源友好型模型研究(如模型压缩、轻量化网络设计)、神经网络架构搜索技术、动态神经网络推理等为资源受限平台上深度学习模型成功且灵活的部署带来了可能。例如MIT的韩松团队提出MCUNet，面向微控制器平台对神经网络架构搜索和推理引擎进行协同设计，进一步增效了深度学习模型在微型设备上的实现。Bl...

【技术保护点】

【技术特征摘要】
1.一种面向微控制器平台的深度学习模型情境自适应压缩方法，其特征在于步骤如下：步骤1：面向微控制器平台，进行轻量化压缩结构块装载设计和电压频率配置对设计；步骤2：感知微控制器动态情境，包括当前剩余运行内存RAM(t)、剩余持久性存储Flash(t)、时延需求L
threshold
(t)和平台电量；步骤3：对面向微控制器的情境自适应软硬协同策略搜索过程进行建模：m＝argmin
a∈A，s∈S
L(B，a，s)L(B，a，s)＝λ1(t)Norm((1
‑
Acc(B，a)))+λ2(t)Norm(EE(B，a，s))s.t.PMU(B，a)＜RAM(t)，MS(B，A)＜Flash(t)，Latency(B，a，s)＜L
threshold
(t)上式通过将模型精度、应用运行能耗设为优化目标，将RAM、Flash及时延需求设为约束，进行了情境指标下适配策略搜索的优化问题建模；其中，A是压缩算子群空间，a为当前的压缩算子选择方案；S是电压频率调整空间，s为当前的电压频率配置方案，m表示当前选取的(a，s)联合策略；式中，L表示确定联合策略的带约束多目标函数，B代表所选取的骨干网络，L
threshold
(t)表示当前的时延预算阈值；<λ1(t)，λ2(t)>为随时间变化的重要性系数，体现了不同时间下对模型精度和运行能耗的权衡取舍，其取决于用户需求或平台资源变化，Norm(
...

【专利技术属性】
技术研发人员：刘思聪，马可，郭斌，於志文，梁韵基，刘云浩，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人