The invention provides a CNN hardware acceleration device for AI chip face recognition, which includes CNN hardware acceleration unit. The CNN hardware acceleration unit is composed of CNN vector arithmetic logic unit, input buffer, output buffer and filter controller. The CNN hardware acceleration unit is connected with central processor and memory through bus, and the CNN hardware acceleration unit acquires transmission through bus. The filter includes face image, direction information, frequency information and effective area mask information. Through the above, the CNN hardware accelerator for AI chip face recognition of the present invention can meet the requirements of throughput and bandwidth while ensuring the accuracy of face recognition to improve the speed of face recognition. The CNN is trained offline, the feed-forward processing is used for recognition, the feedback processing is used for training, and then the real-time task is realized with the trained CNN.
【技术实现步骤摘要】
一种用于AI芯片人脸识别的CNN硬件加速装置
本专利技术涉及AI芯片人脸识别
,尤其涉及一种用于AI芯片人脸识别的CNN硬件加速装置。
技术介绍
人脸识别技术已广泛应用于公安、政府、航天、电力、医疗及众多企事业单位等领域。但是如何在保证识别准确性的前提下进一步提高识别的速度的问题仍然没有得到很好的解决,特别是在资源有限的嵌入式场合下,问题尤为突出。最主流的人脸识别算法是基于特征点的,提取特征点并进行识别的过程计算量大,耗时长。目前针对于人脸识别的软件优化算法有多种,如基于Gabor滤波的快速人脸识别优化算法、基于Gabor特征融合与LSSVM的人脸识别优化算法、基于神经网络稀疏表达的人脸识别算法等,但这些优化算法在提高人脸识别速度的同时,增大了人脸识别过程的总功耗,并且优化的程度有限,算法优化还存在不稳定的问题。因此为人脸识别AI芯片设计专门的卷积神经网络CNN硬件加速单元可在不增加功耗的情况下提高人脸识别的速度,为实现这一目标,在设计中需要在保证计算精度的同时很好的解决吞吐率跟带宽的问题。
技术实现思路
本专利技术主要解决的技术问题是提供一种用于AI芯片人脸识 ...
【技术保护点】
1.一种用于AI芯片人脸识别的CNN硬件加速装置,其特征在于,包括CNN硬件加速单元(1),所述的CNN硬件加速单元(1)由CNN矢量算数逻辑单元(2),输入缓存器(3),输出缓存器(4)和滤波控制器(5)组成,所述的CNN硬件加速单元(1)通过总线(6)与中央处理器(7)和存储器(8)连接,CNN硬件加速单元(1)通过总线(6)获得的输入包括滤波器的人脸图像、方向信息、频率信息和有效区域掩膜信息。
【技术特征摘要】
1.一种用于AI芯片人脸识别的CNN硬件加速装置,其特征在于,包括CNN硬件加速单元(1),所述的CNN硬件加速单元(1)由CNN矢量算数逻辑单元(2),输入缓存器(3),输出缓存器(4)和滤波控制器(5)组成,所述的CNN硬件加速单元(1)通过总线(6)与中央处理器(7)和存储器(8)连接,CNN硬件加速单元(1)通过总线(6)获得的输入包括滤波器的人脸图像、方向信息、频率信息和有效区域掩膜信息。2.根据权利要求1所述的用于AI芯片人脸识别的CNN硬件加速装置,其特征在于,所述的输入缓存器(3)包括输入人脸图像缓存器(9)、方向缓存器(10)、频率缓存器(11)和掩膜缓存器(12);所述输出缓存器(4)为人脸识别加速后的输出人脸图像缓存器(13);输入缓存器(3)和输出缓存器(4)分别连接于CNN矢量算数逻辑单元(2)和滤波控制器(5)之间。3.根据权利要求2所述的用于AI芯片人脸识别的CNN硬件加速装置,其特征在于,所述的输入缓存器(3)的输入信号包括输入人脸图像像素值及其写使能、方向信息及其写使能、频率信息及其写使能、掩膜信息及其写使能;所述的输入缓存器(3)的输出信号包括输入人脸图像像素值及其可写信号,还有CNN窗口位置索引m和n。4.根据权利要求2所述的用于AI芯片人脸识别的CNN硬件加速装置,其特征在于,所述的输出缓存器(4)的输入信号包括输出人脸图像像素值和读使能;所述的输出缓存器(4)的输出信号包括输出人脸图像像素值及其可读信号。5.根据权利要求2所述的用于AI芯片人脸识别的CNN硬件加速装置,其特征在于...
【专利技术属性】
技术研发人员:崔世甲,刘磊,
申请(专利权)人:苏州神指微电子有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。