一种面向微控制器平台的深度学习模型情境自适应压缩方法技术

技术编号:37672626 阅读:15 留言:0更新日期:2023-05-26 04:35
本发明专利技术涉及一种面向微控制器平台的深度学习模型情境自适应压缩方法,首先,基于轻量化压缩结构块装载和电压频率调整设计,搭建起深度学习模型及其所处智能应用的结构压缩和运行模式的自适应联合策略空间。接着,感知微控制器动态情境上下文——包括用户情境和资源情境。最终,在策略搜索空间内利用带约束多目标优化思想求解方案,对深度学习模型及其所处智能应用进行情境自适应的结构压缩和运行调优。本发明专利技术方法将感知动态情境上下文,并利用轻量化压缩结构块装载和电压频率调整,联合生成对应情境下深度学习模型及其所处智能应用的压缩和运行方案,增效模型于微控制器的部署和动态自适应能力。署和动态自适应能力。署和动态自适应能力。

【技术实现步骤摘要】
一种面向微控制器平台的深度学习模型情境自适应压缩方法


[0001]本专利技术为一种面向微控制器平台的深度学习模型情境自适应压缩方法,涉及到深度学习模型及其所处智能应用的情境自适应结构压缩和运行调优领域。

技术介绍

[0002]近些年,深度学习模型逐渐在众多人工智能领域(例如语音识别、计算机视觉、自然语言处理)大发异彩,同时其时间、空间复杂度更呈现爆炸式增长,增加了其于资源受限的移动或嵌入式边端平台的部署难度。在追求普适计算的时代背景下,微控制器(或单片机)以其小体积、低成本、低能耗和高集成度等优势成为未来智能应用极为关键的部署平台之一。但相比智能手机等移动设备,微控制器以其极端受限的存储和计算资源限制(例如主流的STM32系列往往只具备<1MB的运行内存SRAM和<2MB的持久性存储Flash),更大程度地增加了模型部署的难度。此外,除资源条件限制这一挑战外,深度学习模型及其所处智能应用始终处于动态的用户情境(精度、时延、能耗需求等)和资源情境(电量、存储空间等)中。但传统模型往往基于某种特定数据集和固定的拓扑结构训练生成,缺乏一定的动态机制,对情境的自适应能力差。
[0003]已有技术中,一系列资源友好型模型研究(如模型压缩、轻量化网络设计)、神经网络架构搜索技术、动态神经网络推理等为资源受限平台上深度学习模型成功且灵活的部署带来了可能。例如MIT的韩松团队提出MCUNet,面向微控制器平台对神经网络架构搜索和推理引擎进行协同设计,进一步增效了深度学习模型在微型设备上的实现。BlockDrop通过另设一种策略网络,在推理时根据输入样本的复杂度自适应地选择骨干网络的推理路径。但这些技术要么需要时间开销巨大的重训练或结构搜索步骤,缺乏在线快速、低成本调优的自适应基础;要么缺乏与情境自适应的关联,没有考虑模型及智能应用情境的动态变化性。

技术实现思路

[0004]要解决的技术问题
[0005]为了避免现有技术的不足之处,本专利技术提供一种面向微控制器平台的深度学习模型情境自适应压缩方法。面向微控制器(或单片机)

一种未来极为重要的智能应用部署平台,解决其极端限制资源导致的深度学习模型部署难和传统深度学习模型对于部署情境的动态特性适应差的问题。
[0006]技术方案
[0007]一种面向微控制器平台的深度学习模型情境自适应压缩方法,其特征在于步骤如下:
[0008]步骤1:面向微控制器平台,进行轻量化压缩结构块装载设计和电压频率配置对设计;
[0009]步骤2:感知微控制器动态情境,包括当前剩余运行内存RAM(t)、剩余持久性存储Flash(t)、时延需求L
threshold
(t)和平台电量;
[0010]步骤3:对面向微控制器的情境自适应软硬协同策略搜索过程进行建模:
[0011]m=argmin
aεA,s∈S
L(B,a,s)
[0012]L(B,a,s)=λ1(t)Norm((1

Acc(B,a)))+λ2(t)Norm(EE(B,a,s))
[0013]s.t.PMU(B,a)<RAM(t),MS(B,A)<Flash(t),Latency(B,a,s)<L
threshold
(t)
[0014]上式通过将模型精度、应用运行能耗设为优化目标,将RAM、Flash及时延需求设为约束,进行了情境指标下适配策略搜索的优化问题建模;其中,A是压缩算子群空间,a为当前的压缩算子选择方案;S是电压频率调整空间,s为当前的电压频率配置方案,m表示当前选取的(a,s)联合策略;式中,L表示确定联合策略的带约束多目标函数,B代表所选取的骨干网络,L
threshold
(t)表示当前的时延预算阈值;<λ1(t),λ2(t)>为随时间变化的重要性系数,体现了不同时间下对模型精度和运行能耗的权衡取舍,其取决于用户需求或平台资源变化,Norm(
·
)表示目标函数非同量级指标的标准化操作;
[0015]步骤4:完成轻量化压缩结构块装载构成的变体模型群和电压频率配置对的部署以及自适应策略搜索过程的建模后,根据步骤2所感知的动态情境联合适配策略。
[0016]本专利技术进一步的技术方案:步骤1具体如下:
[0017]首先基于对模型真实开销和微控制器固有资源的分析,设计骨干网络模型;接着在模型层面,利用轻量化压缩结构块装载设计,采用不同类型的轻量化卷积计算模式替换传统卷积计算,实现具备不同表现的变体模型群空间A构建,并使用8比特量化技术完成骨干网络和轻量化压缩结构块于微控制器上的部署;同时在平台层面,根据微控制器具体运行规则设计离散的电压频率对,其能使平台上的智能应用具备不同时延、能耗表现,构建起电压频率配置空间S;最终,将两个层面进行联合,形成软硬协同的自适应策略空间M=(A,S),作为后续情境策略搜索的基础。
[0018]本专利技术进一步的技术方案:所述的轻量化卷积计算模式包括深度可分离卷积块、SqueezeNet中的Fire结构块、基于奇异值分解的低秩分解结构块和多分支并行结构块。
[0019]一种计算机系统,其特征在于包括:一个或多个处理器,计算机可读存储介质,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的方法。
[0020]一种计算机可读存储介质,其特征在于存储有计算机可执行指令,所述指令在被执行时用于实现上述的方法。
[0021]有益效果
[0022]本专利技术提供的一种面向微控制器平台的深度学习模型情境自适应压缩方法,首先,基于轻量化压缩结构块装载和电压频率调整设计,搭建起深度学习模型及其所处智能应用的结构压缩和运行模式的自适应联合策略空间,每种策略具备不同实际表现(如精度、存储占用、时延和能耗等)。接着,感知微控制器动态情境上下文——包括用户情境和资源情境。最终,在策略搜索空间内利用带约束多目标优化思想求解方案,对深度学习模型及其所处智能应用进行情境自适应的结构压缩和运行调优。本专利技术方法将感知动态情境上下文,并利用轻量化压缩结构块装载和电压频率调整,联合生成对应情境下深度学习模型及其所处智能应用的压缩和运行方案,增效模型于微控制器的部署和动态自适应能力。
附图说明
[0023]附图仅用于示出具体实施例的目的,而并不认为是对本专利技术的限制,在整个附图中,相同的参考符号表示相同的部件。
[0024]图1为本专利技术面向微控制器平台的深度学习模型情境自适应压缩方法的示意框架;
[0025]图2为本专利技术基于轻量化压缩结构块装载设计的变体模型群空间搭建及于微控制器部署的示意图。
具体实施方式
[0026]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向微控制器平台的深度学习模型情境自适应压缩方法,其特征在于步骤如下:步骤1:面向微控制器平台,进行轻量化压缩结构块装载设计和电压频率配置对设计;步骤2:感知微控制器动态情境,包括当前剩余运行内存RAM(t)、剩余持久性存储Flash(t)、时延需求L
threshold
(t)和平台电量;步骤3:对面向微控制器的情境自适应软硬协同策略搜索过程进行建模:m=argmin
a∈A,s∈S
L(B,a,s)L(B,a,s)=λ1(t)Norm((1

Acc(B,a)))+λ2(t)Norm(EE(B,a,s))s.t.PMU(B,a)<RAM(t),MS(B,A)<Flash(t),Latency(B,a,s)<L
threshold
(t)上式通过将模型精度、应用运行能耗设为优化目标,将RAM、Flash及时延需求设为约束,进行了情境指标下适配策略搜索的优化问题建模;其中,A是压缩算子群空间,a为当前的压缩算子选择方案;S是电压频率调整空间,s为当前的电压频率配置方案,m表示当前选取的(a,s)联合策略;式中,L表示确定联合策略的带约束多目标函数,B代表所选取的骨干网络,L
threshold
(t)表示当前的时延预算阈值;<λ1(t),λ2(t)>为随时间变化的重要性系数,体现了不同时间下对模型精度和运行能耗的权衡取舍,其取决于用户需求或平台资源变化,Norm(
...

【专利技术属性】
技术研发人员:刘思聪马可郭斌於志文梁韵基刘云浩
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1