【技术实现步骤摘要】
一种卷积神经网络图像处理系统及方法
[0001]本专利技术属于图像处理系统领域,具体涉及一种卷积神经网络图像处理系统及方法。
技术介绍
[0002]由于AI运算的数据吞吐大,系统大量的时间和功耗用于搬运数据,于是存算一体芯片成为研究热点,它将计算单元分散在存储单元附近,从而实现极大规模的并行计算,突破冯诺依曼架构,使得芯片峰值算力显著提高,同等算力下功耗显著降低。卷积神经网络(CNN)在图象识别领域已获得广泛应用,但由于目前CMOS图象传感器的像素阵列与主机系统之间的通信是逐点传输,即使主机系统使用存算一体芯片,也提升不了传输速度,当像素和帧率高时,需要以很高的频率进行通信,从而产生高功耗高成本等一系列问题,这种结构成为实时视觉设备进行CNN计算的瓶颈,不能满足小微型嵌入式、移动式智能设备,如野外工作机器人、手持设备进行视觉识别及定位的要求。
技术实现思路
[0003]本专利技术的目的在于提供一种卷积神经网络图像处理系统及方法,以克服现有技术的不足。
[0004]为达到上述目的,本专利技术采用如下技术 ...
【技术保护点】
【技术特征摘要】
1.一种卷积神经网络图像处理系统,其特征在于,包括CMOS图象传感器像素阵列单元、中央处理单元CPU和NPU阵列单元,中央处理单元CPU和NPU阵列单元通过一组全局总线连接,NPU阵列单元中每个NPU单元均并口连接有四个NPU单元,CMOS图象传感器像素阵列单元均分为与NPU阵列单元中NPU单元个数相同的区域,CMOS图象传感器像素阵列单元的每个区域通过局部总线连接一个NPU单元,中央处理单元CPU连接有程序存储器ROM和动态随机存储器RAM,中央处理单元CPU通过通信接口与外部通信,中央处理单元CPU用于将NPU单元程序通过全局总线载入到NPU单元的程序存储器,NPU单元根据NPU单元程序通过局部总线读入CMOS图象传感器像素阵列单元数据,然后与中央处理单元CPU对读入的数据协同进行预处理,然后对图像预处理后的图像进行卷积运算,并通过中央处理单元CPU输出运算结果。2.根据权利要求1所述的一种卷积神经网络图像处理系统,其特征在于,局部总线包括局部数据总线、局部地址总线及局部控制总线。3.根据权利要求1所述的一种卷积神经网络图像处理系统,其特征在于,每个NPU单元为一个独立计算单元,NPU单元的程序存储器采用动态随机存储器RAM或可擦写Flash或程序存储器ROM。4.根据权利要求1所述的一种卷积神经网络图像处理系统,其特征在于,每个NPU单元有1个选中脚与中央处理单元CPU联接,或者使用二制进编码的全局地址总线。5.根据权利要求1所述的一种卷积神经网络图像处理系统,其特征在于,每个局...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。