【技术实现步骤摘要】
面向边缘侧多模态Transformer模型的推理卸载优化方法
[0001]本专利技术属于边缘测深度学习模型
,具体涉及一种面向边缘侧多模态
Transformer
模型的推理卸载优化方法
。
技术介绍
[0002]在现实生活中,人们接触的信息大多是多模态的,例如文字
、
图像
、
声音
、
视频等
。
对于人类来说,理解这些不同类型的信息,并结合它们进行决策是非常自然的,但对于计算机模型来说,这却是一项极具挑战性的任务
。
基于
Transformer
多模态模型的出现
(
如
CLIP
,
ViLBERT
,
VisualBERT)
,使得计算机模型能够更好地理解和生成多模态信息,极大地拓宽了人工智能的应用领域,比如视觉问答
、
自动字幕生成
、
社交媒体分析
、
在线广告
、
自动驾驶等领域
。
[0003]尽管基于
Transformer
的多模态模型具有诸多优势和广泛的应用潜力,但它的模型规模通常较大,并且计算复杂度较高
。
对于一些对延迟需求高的应用,在资源受限的边缘设备上运行仍需要推理卸载优化,以在满足内存约束的同时减少推理的延迟
。
然而,
Transformer
中独特的架 ...
【技术保护点】
【技术特征摘要】
1.
一种面向边缘侧多模态
Transformer
模型的推理卸载优化方法,其特征在于,包括:步骤1,通过对基于
Transformer
的多模态模型进行分析,得到计算节点图
、
输入输出形状
、
内存占用的信息;步骤2,通过分割卸载优化算法计算出最优的分割卸载策略;步骤3,将各计算节点的计算任务根据该分割卸载策略进行分割卸载执行
。2.
根据权利要求1所述的面向边缘侧多模态
Transformer
模型的推理卸载优化方法,其特征在于,步骤1包括:步骤
1.1
,对实验进行配置,确定基于
Transformer
的多模态模型以及其计算图,设备配置;步骤
1.2
,各设备通过通信模块两两之间建立
TCP
长连接,并分析出两两之间的上下行带宽;步骤
1.3
,主模块通过通信模块通知各设备的离线分析模块分析出各设备的可用内存;步骤
1.4
,主模块通过对多模态模型分析得到模型中
Transformer
编码器中的多头注意力块中的计算节点图以及其输入输出形状,以及每个节点对应权重的内存占用并对节点进行编号;步骤
1.5
,主模块通过通信模块通知各设备的离线分析模块分析出各设备上各节点在当前设备上的执行时间与输入之间的对应映射,各设备的离线分析模块通过通信模块将分析出的结果发送到主模块中
。3.
根据权利要求2所述的面向边缘侧多模态
Transformer
模型的推理卸载优化方法,其特征在于,步骤3中包括:步骤
3.1
,主模块将分割卸载策略以及对应的权重发送到对应设备的调度模块中,各设备调度模块根据分割策略创建多个任务模块;步骤
3.2
,将各个任务模块加载下一个多头自注意力块中的对应节点的权重到设备的内存或者显存中;步骤
3.3
,主模块计算嵌入部分,然后根据第一个节点的分割卸载策略将嵌入部分的输出分割发送到各个设备中;步骤
3.4
,各设备接收输入数据,根据分割卸载策略将对应范围的输入发送到所有设备对应的任务模块中;步骤
3.5
,各任务模块接收到数据后放入模块内部的缓冲区,如果缓冲区中数据满足分割卸载策略中对当前任务模块指定的输入范围,将可执行标志记为
True
,否则记为
False
;步骤
3.6
,各设备调度模块对当前计算节点对应的任务模块的可执行标记进行判断,如果可执行标记为
False
,则等待执行,回到步骤
3.4
,如果可执行标记为
True
,直接执行,然后根据分割策略将对应范围的输出发送到对应设备的对应任务模块中;步骤
3.7
,判断是否还有下一个节点,有,将下一个节点设置为当前节点,转到步骤
3.6
,没有,继续进行步骤
3.8
;步骤
3.8
,继续步骤
3.4
,直到当前多头自注意力块在所有设备的所有的节点执行完毕;步骤
3.9
,各设备根据第1个节点在各设备的分割卸载策略,将计算图中最后一个节点在各设备上的部分执行结果,发送到第1个节点在各设备所需输入范围的数据到对应设备上去;
步骤
3.10
,各任务模块加载下一个多头自注意力块中对应节点的相应的权重,并继续步骤
1.11
,直到当前
Transformer
编码器中所有的多头自注意力块被执行完毕,并将结果传输回主模块;步骤
3.11
,主模块继续计算剩余的部分
。4.
根据权利要求1所述的面向边缘侧多模态
Transformer
模型的推理卸载优化方法,其特征在于,步骤2包括:步骤
2.1
,将分割卸载优化问题形式化为一个带有约束的优化问题;步骤
2.2
,通过遗传算法进行求解
。5.
根据权利要求4所述的面向边缘侧多模态
Transformer
模型的推理卸载优化方法,其特征在于,步骤
2.1
中,每个计算节点产生一个针对输出的分割策略,其分割维度沿...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。