当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于FPGA的视觉自注意力加速器优化方法技术

技术编号:40516079 阅读:31 留言:0更新日期:2024-03-01 13:32
本发明专利技术公开了一种基于FPGA的视觉自注意力加速器优化方法,包括以下步骤:通过动态令牌剪枝方案对视觉自注意力模型进行动态令牌剪枝,去除冗杂信息,减少视觉自注意力模型的计算量;通过在FPGA上的单个视觉自注意力计算层的设计方式、使用矩阵切块的方式对计算过程进行分割,基于遗传算法求解最优的计算资源分配策略,实现最大化负载均衡;本发明专利技术减少计算量,降低模型运行时间,提高加速器的运行效率。

【技术实现步骤摘要】

本专利技术涉及电子信息,更具体的,涉及一种基于fpga的视觉自注意力加速器优化方法。


技术介绍

1、相较于传统卷积神经网络cnn网络,视觉自注意力模型的参数量很大且每次推理也包含更大的计算量。模型参数量及计算量的增加对计算单元的性能与fpga设计带宽提出了更高的要求,因此如何对现有模型进行压缩并高效利用片上的计算资源是加速器设计中的重要问题。

2、在软件算法方面,视觉任务中令牌信息包含较大的冗余,探索并去除冗余信息可极大减少视觉自注意力的计算量。根据每层令牌冗余选择最优的令牌剪枝比例能既保持模型性能的同时,也减少计算量。

3、在硬件加速器设计方面,在视觉自注意力模型中存在多个“中间计算结果-中间计算结果”乘法以及层归一化(layer normalization)等操作,这意味着该计算无法与卷积神经网络(convolutional neural networks,cnn)中的算子共用一套计算单元,即无法将模型参数重排后存储至加速器中再与中间结果计算。

4、因此,在视觉自注意力模型加速器设计中,需要针对其中不同的计算范式设计本文档来自技高网...

【技术保护点】

1.一种基于FPGA的视觉自注意力模型加速器优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于FPGA的视觉自注意力模型加速器优化方法,其特征在于,所述的动态令牌剪枝方案具体如下:

3.根据权利要求2所述的一种基于FPGA的视觉自注意力模型加速器优化方法,其特征在于,针对动态令牌剪枝方案,使用异步优势动作评价算法分别建模智能体的奖励函数及最优策略;

4.根据权利要求2所述的一种基于FPGA的视觉自注意力模型加速器优化方法,其特征在于,奖励函数为智能体的剪枝效果进行评分,并作为环境反馈的一部分对智能体参数进行训练,优化智能体的行为;<...

【技术特征摘要】

1.一种基于fpga的视觉自注意力模型加速器优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于fpga的视觉自注意力模型加速器优化方法,其特征在于,所述的动态令牌剪枝方案具体如下:

3.根据权利要求2所述的一种基于fpga的视觉自注意力模型加速器优化方法,其特征在于,针对动态令牌剪枝方案,使用异步优势动作评价算法分别建模智能体的奖励函数及最优策略;

4.根据权利要求2所述的一种基于fpga的视觉自注意力模型加速器优化方法,其特征在于,奖励函数为智能体的剪枝效果进行评分,并作为环境反馈的一部分对智能体参数进行训练,优化智能体的行为;

5.根据权利要求1所述的一种基于fpga的视觉自注意力模型加速器优化方法,其特征在于,加速器包括注意力计算子系统、前向网络计算子系统、axi读写命令控制模块、第一选择器、权重缓存模块;

6....

【专利技术属性】
技术研发人员:黄以华林海燕罗聪慧
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1