【技术实现步骤摘要】
本申请涉及人工智能,尤其是涉及一种卷积神经网络加速方法、装置、设备及存储介质。
技术介绍
1、随着人工智能的热潮和人工智能算法的广泛应用,深度学习已成为当前ai研究的重点,在自动驾驶、环境感知、传感器融合、控制决策等领域都会涉及深度学习。深度学习基于神经网络模型处理、分析高维度的数据,卷积神经网络是神经网络的一种特殊和扩展形式,在图像、视频、语音等信号数据的分类和识别任务上表现出色。
2、在面对海量数据的并行运算的同时做到高效、可靠,即意味着承载人工智能算法的计算平台需要提供足够的性能加速,也即ai芯片的算力足够用,同时还需要考虑其他因素,如功耗还不能超标,能效比越高越好。fpga诞生于1990年代,fpga最初是为电子硬件原型的快速发展而开发的,由于fpga并行处理的机制,可以满足神经网络大量并行运算的需求,并且相对于gpu/cpu成本优势较为明显,因此越来越多的厂家选择利用fpga实现神经网络处理器的算力部署。
3、然而,现有的fpga实现卷积神经网络算力部署的方案中,由于fpga的通用性和可编程性,使得fp
...【技术保护点】
1.一种卷积神经网络加速方法,其特征在于:所述方法应用于卷积神经网络加速系统,所述卷积神经网络加速系统基于多die芯片,所述卷积神经网络加速系统包括同步动态随机存储器、超级逻辑域块和卷积神经网络核,所述方法包括:
2.根据权利要求1所述的方法,其特征在于:所述卷积神经网络加速系统包含若干超级逻辑域块,所述将所述卷积神经网络核放置到所述超级逻辑域块包括:
3.根据权利要求2所述的方法,其特征在于:所述将若干所述卷积神经网络子核放置到若干所述超级逻辑域块包括:
4.根据权利要求2所述的方法,其特征在于:所述将若干所述卷积神经网络子核放置
...【技术特征摘要】
1.一种卷积神经网络加速方法,其特征在于:所述方法应用于卷积神经网络加速系统,所述卷积神经网络加速系统基于多die芯片,所述卷积神经网络加速系统包括同步动态随机存储器、超级逻辑域块和卷积神经网络核,所述方法包括:
2.根据权利要求1所述的方法,其特征在于:所述卷积神经网络加速系统包含若干超级逻辑域块,所述将所述卷积神经网络核放置到所述超级逻辑域块包括:
3.根据权利要求2所述的方法,其特征在于:所述将若干所述卷积神经网络子核放置到若干所述超级逻辑域块包括:
4.根据权利要求2所述的方法,其特征在于:所述将若干所述卷积神经网络子核放置到若干所述超级逻辑域块包括:
5.根据权利要求1或4所述的方法,其特征在于:所述同步动态随机存储器包括第一同步动态随机存储器和第二同步动态随机存储器;
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:深存科技无锡有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。