【技术实现步骤摘要】
基于神经网络的图像识别装置和图像识别方法
[0001]本公开涉及图像识别领域,具体地,涉及一种基于神经网络的图像识别系统和图像识别方法。
技术介绍
[0002]图像识别属于深度神经网络(DNN)在图像处理、模式识别、机器视觉综合领域的一个典型应用场景,近年来人工卷积神经网络(CNN)使得图像识别分类精度和准确度取得很大的进步。在人工智能识别领域,存在云计算和边缘计算两种应用场合。云计算等主要依赖服务器等通用处理器(CPU)、图形处理器(GPU)进行识别。CPU存在速度很慢、功耗也比较大、多处理器难于协同等问题。GPU的功耗较大,成本较高,不适用于边缘计算应用场合。随着物联网的发展,云计算并不总是那么高效的,尤其是在图像智能识别方面,边缘端产生的图像数据正在逐步增加,图像数据传输过程产生较大延迟,如果能够在边缘端的节点处处理、分析数据,那么这种计算模型会更高效。在现有针对边缘端的图像识别硬件加速技术中,一些技术采用增加浮点计算单元DSP、ALU进行加速,但是这些技术存在功耗大、成本高的问题;一些技术采用脉动阵列进行卷积加速,但 ...
【技术保护点】
【技术特征摘要】
1.一种基于神经网络的图像识别装置,包括:图像缓存,被配置为接收并存储待识别的图像;特征图缓存,被配置为接收并存储特征图;权重缓存,被配置为接收并存储权重;控制器,包括配置信息寄存器,并且被配置为接收配置信息并且将所述配置信息存储在所述配置信息寄存器中,根据所述配置信息生成第一控制信号和第二控制信号,并且发送所述第一控制信号和所述第二控制信号;所述预处理单元,被配置为分别从所述图像缓存和所述权重缓存获得所述待识别的图像和所述权重,从所述控制器接收所述第一控制信号,根据所述第一控制信号对所述待识别的图像和所述权重执行预处理以得到预处理结果,并且发送所述预处理结果;以及处理单元阵列,被配置为从所述预处理单元接收所述预处理结果,从所述控制器接收所述第二控制信号,根据所述第二控制信号对所述预处理结果执行处理以得到特征图,并向所述特征图缓存发送所述特征图。2.根据权利要求1所述的图像识别装置,其中,所述预处理单元被进一步配置为:从所述特征图缓存接收所述特征图,根据所述第一控制信号确定所述特征图是否是最终特征图,如果否,则对所述特征图和所述权重执行预处理以得到预处理结果,并且向所述处理单元阵列发送所述预处理结果;如果是,则指示所述特征图缓存发送所述特征图。3.根据权利要求2所述的图像识别装置,其中,所述控制器还包括状态寄存器和控制状态机,其中所述预处理单元被进一步配置为在完成所述预处理中的多个操作中的一个操作之后向所述状态寄存器发送第一状态信号,从所述控制状态机接收第一状态控制信号,并且根据所述第一状态控制信号执行所述多个操作中的在所述一个操作之后的下一个操作;以及所述状态寄存器被配置为在接收到所述第一状态信号之后存储所述第一状态信号,并且所述控制状态机被配置为根据所述状态寄存器中存储的所述第一状态信号生成所述第一状态控制信号,并且向所述预处理单元发送所述第一状态控制信号。4.根据权利要求3所述的图像识别装置,其中,所述处理单元阵列被进一步配置为在完成所述处理中的多个操作中的一个操作之后向所述状态寄存器发送第二状态信号,从所述控制状态机接收第二状态控制信号,并且根据所述第二状态控制信号执行所述多个操作中的在所述一个操作之后的下一个操作;以及所述状态寄存器被进一步配置为在接收到所述第二状态信号之后存储所述第二状态信号,并且所述控制状态机被进一步配置为根据所述状态寄存器中存储的所述第二状态信号生成所述第二状态控制信号,并且向所述处理单元阵列发送所述第二状态控制信号。5.根据权利要求2所述的图像识别装置,其中,所述多个处理单元中的每一个处理单元包括乘法器阵列和加法树。6.根据权利要求2所述的图像识别装置,其中,所述配置信息包括所述神经网络的结构信息和所述待识别的图像的大小,其中所述神经网络的结构信息指示卷积处理、激活处理、池化处理和全连接处理中要执行的一个或多个处理,并且所述处理单元阵列被进一步配置为通过以下方式来根据所述第二控制信号对所述预处理结果执行处理以得到特征图:
根据所述第二控制信号对所述预处理器结果依次执行所述卷积处理、所述激活处理、所述池化处理和所述全连接处理中的由所述神经网络的结构信息指示的所述一个或多个处理以得到所述特征图。7.根据权利要求6所述的图像识别装置,其中,所述处理单元阵列包括:多个处理单元,被配置为执行所述卷积处理和所述全连接处理;多个激活单元,被配置为执行所述激活处理;以及多个池化单元,被配置为执行所述池化处理。8.根据权利要求6所述的图像识别装置,其中,所述预处理单元被进一步配置为通过以下方式来根据所述第一控制信号对所述待识别的图像和所述权重执行预处理:根据所述神经网络的结构信息和所述待识别的图像的大小对所述待识别的图像执行大小调整和填充处理以得到处理后的图像并且对所述处理后的图像以及所述权重执行分块操作。9.根据权利要求2所述的图像识别装置,其中,所述特征图缓存包括多个缓存区,所述多个缓存区包括多个写缓存区和多个读缓存区,并且其中,所述控制器被进一步配置为监测所述多个写缓存区中正在写入数据的缓存区的第一编号以及所述多个读缓存区中正在读取数据的读缓存区的第二编号,并且当所述第一编号与所述第二编号之差小于第一阈值时,发出中断信号以中断所述图像识别装置的操作。10.根据权利要求2所述的图像识别装置,其中,所述权重缓存包括多个缓存区,所述多个缓存区包括多个写缓存区和多个渎缓存区,并且其中,所述控制器被进一步配置为监测所述多个写缓存区中正在写入数据的缓存区的第一编号以及所述多个读缓存区中正在读取数据的读缓存区的第二编号,并且当所述第一编号与所述第二编号之差小于第二阈值时,发出中断信号以中断所述图像识别装置的操作。11.根据权利要求7所述的图像识别装置,其中,所述池化处理包括最大值池化或平均值池化。12.根据权利要求7所述的图像识别装置,其中,所述多个激活单元使用relu激活函数、leakey relu激活函数、sigmod激活函数或tanh激活函数来执行所述激活处理。13.根据权利要求2所述的图像识别装置,还包括:通用处理器,被配置为存储所述待识别的图像和所述权重,并且向所述图像缓存发送所述待识别的图像并向所述权重缓存发送所述权重。14.根据权利要求13所述的图像识别装置,其中,所述图像缓存通过第一多通道直接存储器存取MCDMA从所述通用处理器接收所述待识别的图像,并且所述权重缓存通过第二MCDMA从所述通用处理器接收所述权重。15.根据权利要求13所述的图像识别装置,还包括:存储器,被配置为存储第一密码,其中,所述通用处理器被进一步配置为向所述控制器发送第二密码,并且所述控制器被进一步配置为响应于从所述通用处理器接收到所述第二密码,从所述存储器获取所述第一密码,并且将所述第一密码与所述第二密码进行比较,当所述第一密码与所述第二密...
【专利技术属性】
技术研发人员:周培涛,陈志强,张丽,李元景,邓智,李波,唐虎,焦凌云,孙运达,邢宇翔,高河伟,焦亚涛,廖磊,付世航,岳小兵,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。