【技术实现步骤摘要】
一种手写数字识别实现方法
[0001]本专利技术属于图像识别领域,具体为一种手写数字识别实现方法。
技术介绍
[0002]目前,人类手写字的识别问题成为了研究热点。这项技术已经被广泛应用在税务表处理、邮件分类和电脑阅卷等方面。在这些应用中通常要求手写数字识别算法具有较高的识别速度和识别精度以及较高的可靠性和稳定性。手写数字的类别虽然只用十种,笔画简单,但是其识别问题仍然存在很大的困难。现有的一些测试结果已经表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别率高甚至。主要原因是字体相差不大,每个人的写法不一样,这就使识别更加困难。如何利用设备自动化、智能化、高效的识别数字和字符,提高工作效率则已成为当前亟待解决的研究问题。
[0003]卷积神经网络的概念在1998年由纽约大学的Yann Le Cun提出,是一个可以成功应用在手写字符识别、车牌识别等很多图像分类上的神经网络。卷积神经网络的本质就是多层感知机的一种。之所以卷积神经网络可以成功应用的在很多方面,主要是因为卷积神经网络的稀疏连接和 ...
【技术保护点】
【技术特征摘要】
1.一种手写数字识别实现方法,其特征在于,包括以下步骤:步骤1、获取图像数据,在PL端完成视频数据的采集,并对数字采集区域完成图像的预处理;步骤2、将预处理后的数据存储在PL端的BRAM存储单元中里;步骤3、对卷积神经网络参数进行定点化转换,存入集成ARM与FPGA的嵌入式平台ZYNQ中的ROM IP单元内;步骤4、针对卷积神经网络的卷积核尺寸,构造相应的卷积矩阵,完成预处理后的数据与定点化参数的卷积运算;步骤5、对卷积层运算结果进行激活处理,并对激活结果进行最大池化运算;步骤6、对池化后的数据,构造相应的视频时序,利用Video In to AXI4
‑
Stream IP核和VDMAIP核将池化结果传输至PS端DDR;步骤7、PS端完成卷积神经网络的隐藏层和输出层运算,将识别结果通过AXI
‑
lite传输至PL端,PL端驱动显示器,在显示画面中实现识别结果的显示功能。2.根据权利要求1所述的手写数字识别实现方法,其特征在于,步骤1中对数字采集区域进行的图像的预处理包括:灰度转换、平滑降噪、二值化、降采样处理。3.根据权利要求1所述的手写数字识别实现方法,其特征在于,步骤3对卷积神经网络的权重参数值采用定点化运算的方式进行浮点数处理,通过对权值参数扩大一定的整数倍得到定点数。4.根据权利要求1所述的手写数字识别实现方法,其特征在于,使用5个ROM IP核来存储权重参数,卷积核的大小为5*5,每个ROM里面存储150个权重参数,按照5*5矩阵方式排列。5.根据权利要求1所述的手写数字识别实现方法,其特征在于,针对卷积神经网络的卷积核尺...
【专利技术属性】
技术研发人员:靳欣,张俊举,李智博,张经纬,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。