一种用于执行多任务卷积神经网络预测的装置和方法制造方法及图纸

技术编号：29134727 阅读：21 留言：0更新日期：2021-07-02 22:30

本发明专利技术提供一种用于执行多任务卷积神经网络预测的装置和方法，包括：控制接口、内存单元、总线复用器和加速器单元，控制接口用于接收指令输入，并发送至加速器单元；内存单元用于存储数据信息、卷积层参数和激活函数；总线复用器用于连接各单元，传输数据和指令信息；加速器单元包含：用于访问内存单元中存储的数据和指令信息的总线复用器，用于分配卷积控制指令的卷积调度器，用于预取和存信息的数据缓存器和卷积核缓存器，用于下达计算任务的卷积核控制器，用于完成卷积核运算的多组乘加阵列，完成运算后将结果输入内存单元。本发明专利技术可对用于执行多任务卷积神经网络的训练进行加速，可大程度降低训练耗时和硬件成本，有效提高执行效率和适用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于执行多任务卷积神经网络预测的装置和方法
本专利技术涉及计算机和图像处理领域，并且更具体地，涉及一种用于执行多任务卷积神经网络预测的装置和方法。
技术介绍
近年来计算机技术和人工智能技术高速发展，随着摩尔定律几近失效，新的芯片物理材料始终没有取得重大突破之前，常规处理器的计算性能也逼近极限，2012年AlexNet开启这一轮深度学习热潮的时候，网络只有8层，但就算只有8层也需要大量的计算，2016年153层的ResNet以及最近甚至出现了上千层的网络结构，需要更强大的计算资源来支撑网络训练。但是随着现在云计算，大数据，移动互联网，人工智能，5G的蓬勃兴起，尤其是计算机视觉技术应用中对于图像处理能力的高要求，对于处理器的算力要求越来越高，因此这两者存在的矛盾将不可避免且亟待解决。与此同时，随着图像处理算法的日益复杂，有的负责算法(程序)，同时具有通用计算、并行计算、卷积计算其中的一种或者是几种，但是现世面上的并没有一种通用的硬件架构，可以在不需要增加硬件架构规模的基础上同时加速上述描述的复杂算法。随着人工智能、智能识别、超级计算等算法的日益复杂，对于具备同时加速通用计算、并行计算、卷积计算的要求也越来越紧迫。神经网络和深度学习目前为处理图像识别的许多问题提供了最佳解决方案，而基于多任务卷积神经网络(MTCNN)的图像检测技术可以解决传统算法对环境要求高、人脸要求高、检测耗时高的弊端，但依然需要硬件提供较高的算力和内存带宽，现有技术中，基于FPGA平台和RIS-V处理器的硬件可以实现小型化模块和一定程度的加...

【技术保护点】
1.一种用于执行多任务卷积神经网络预测的装置和方法，其特征在于，所述装置包括：控制接口、内存单元、总线复用器和加速器单元，所述控制接口，用于接收指令输入，并发送至加速器单元；所述内存单元，用于存储数据信息、卷积层参数和激活函数；所述总线复用器，用于连接各单元，传输数据和指令信息；所述加速器单元含数据缓存器、卷积核缓存器、卷积核控制器、卷积调度器和若干组乘加阵列，所述加速器单元用于分配处理多任务卷积神经网络执行过程中的各类任务，通过所述总线复用器访问所述内存单元中存储的数据和指令信息，所述卷积调度器通过所述总线复用器调取并分配卷积控制指令，所述数据缓存器根据卷积控制指令驱动进行数据预取和存储，所述卷积核缓存器根据卷积控制指令驱动进行卷积核预取和存储，所述卷积核控制器根据卷积控制指令驱动分别访问并读取所述数据缓存器和卷积核缓存器中相应数据信息，并将所述数据信息发送至所述乘加阵列完成卷积核运算，完成运算后通过量化回写经总线复用器将结果输入内存单元相应地址。/n

【技术特征摘要】
1.一种用于执行多任务卷积神经网络预测的装置和方法，其特征在于，所述装置包括：控制接口、内存单元、总线复用器和加速器单元，所述控制接口，用于接收指令输入，并发送至加速器单元；所述内存单元，用于存储数据信息、卷积层参数和激活函数；所述总线复用器，用于连接各单元，传输数据和指令信息；所述加速器单元含数据缓存器、卷积核缓存器、卷积核控制器、卷积调度器和若干组乘加阵列，所述加速器单元用于分配处理多任务卷积神经网络执行过程中的各类任务，通过所述总线复用器访问所述内存单元中存储的数据和指令信息，所述卷积调度器通过所述总线复用器调取并分配卷积控制指令，所述数据缓存器根据卷积控制指令驱动进行数据预取和存储，所述卷积核缓存器根据卷积控制指令驱动进行卷积核预取和存储，所述卷积核控制器根据卷积控制指令驱动分别访问并读取所述数据缓存器和卷积核缓存器中相应数据信息，并将所述数据信息发送至所述乘加阵列完成卷积核运算，完成运算后通过量化回写经总线复用器将结果输入内存单元相应地址。

2.根据权利要求1所述一种用于执行多任务卷积神经网络预测的装置，其特征在于，所述内存单元为一个或多个板载内存芯片；所述总线复用器中是一个非直接分裂的拓展设备；所述加速器单元是由一组或多组缓存器和控制器以及若干组乘加阵列组成；所述乘加阵列是有多组乘法器和加法器按照特定组合构成。

3.根据权利要求1和2所述一种用于执行多任务卷积神经网络预测的装置，其特征在于，所述内存单元中的数据预先进行地址段化处理，分别存储用于执行多任务卷积神经网络预测的数据和指令信息。

4.根据权利要求1所述一种用于执行多任务卷积神经网络预测的方法，其特征在于，将用于执行多任务卷积神经网络预测的数据信息、卷积层参数和激活函数及阈值预存储于所述内存单元，用于执行多任务卷积神经网络预测的一系列指令通过所述控制接口输入到所述卷积调用器，所述卷积调用器通过总线复用器访问内存单元的数据和卷积核地址，进行数据和卷积核预取，并分别存储于数据缓存器和卷积核缓存器中，所述卷积控制器通过所述卷积调度器发出的卷积控制指令调用所述两缓存器中的卷积数据，并通过所述乘加阵列执行...

【专利技术属性】
技术研发人员：李海青，吴岳，侯广琦，
申请(专利权)人：天津中科虹星科技有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人