一种面向FPGA的多目标网络结构的构建方法技术

技术编号:31314791 阅读:34 留言:0更新日期:2021-12-12 22:51
本发明专利技术公开了一种面向FPGA的多目标网络结构的构建方法,包括:构建轻量化、可伸缩并易收敛的网络结构搜索候选模块,对所述候选模块在FPGA平台上的时延进行测试并记录,并设计可微化的时延指标约束函数;设计有向无环图的过参数化网络搜索空间和设计无代理的二阶段网络搜索策略,加速网络结构的搜索过程;将所述时延约束指标函数加入基于梯度下降的反向传播算法中,构建多目标综合搜索损失函数;根据所述多目标综合搜索损失函数,生成适配FPGA的轻量级网络结构。与同等精度水平的手工轻量级神经网络相比,本发明专利技术构建的轻量级网络结构在FPGA上具备更高的实时性,更小的模型体积和更少的模型运算量。少的模型运算量。少的模型运算量。

【技术实现步骤摘要】
一种面向FPGA的多目标网络结构的构建方法


[0001]本专利技术涉及网络结构搜索
,特别涉及一种面向FPGA的多目标网络结构的构建方法。

技术介绍

[0002]伴随着深度学习技术迅猛发展,深度神经网络在计算机视觉、语音识别、自然处理等领域实现了跨越式的突破。然而深度学习算法在工业、制造业和航天航海等领域还没得到非常广泛的应用,其中一个原因就是深度学习网络的模型庞大、计算量巨大,一个CNN网络的权重文件动辄数百兆,例如AlexNet有着61M的参数、249MB的内存,复杂的VGG16及VGG19的内存容量已经超过500MB,并且由于卷积神经网络的本质是乘加运算的堆叠,复杂的网络结构被用来提升网络模型性能的同时会造成计算量的大幅增加,这些意味着需要更大的存储容量和更多的浮点运算。
[0003]由于移动平台和嵌入式设备局限于其有限的内存,和计算处理单元,导致以精度为主要设计指标的CNN模型在这些平台上的部署面临巨大挑战,难以保证网络性能和网络快速部署之间的平衡,无法满足嵌入式平台上的实时性需求,无法针对不同的嵌入式平台硬件特性对网络结本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向FPGA的多目标网络结构的构建方法,其特征在于,包括:构建轻量化、可伸缩并易收敛的网络结构搜索候选模块,对所述候选模块在FPGA平台上的时延进行测试并记录,并设计可微化的时延指标约束函数;设计有向无环图的过参数化网络搜索空间和设计无代理的二阶段网络搜索策略,加速网络结构的搜索过程;将所述时延约束指标函数加入基于梯度下降的反向传播算法中,构建多目标综合搜索损失函数;根据所述多目标综合搜索损失函数,生成适配FPGA的轻量级网络结构。2.根据权利要求1所述的一种面向FPGA的多目标网络结构的构建方法,其特征在于,构建轻量化、可伸缩并易收敛的网络结构搜索候选模块,包括:将卷积计算算子,激活算子,跳链接操作进行组合;所述卷积算子采用深度可分离算子,外加设计通道扩展因子,引入了残差结构,添加跳连接,组合成网络结构搜索候选模块。3.根据权利要求2所述的一种面向FPGA的多目标网络结构的构建方法,其特征在于,设计有向无环图的过参数化网络搜索空间,包括:根据目标任务的输入数据,预设定若干固定模块,分别在网络结构的前后两端;中间是可学习块部分,由轻...

【专利技术属性】
技术研发人员:姜宏旭田方正李波李晓宾张润华胡宗琦常云洋
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1