This application belongs to the technical field of character recognition, in particular to a method, system and electronic equipment for recognizing Uygur handwritten letters. The method for recognizing Uygur handwritten letters includes: step a: collecting/reading/reading original handwritten samples of Uygur letters; step b: preprocessing the original handwritten samples and converting the original handwritten samples into binary images; step c: input the binary images into convolutional neural network for classification training. The recognition results of the original handwritten samples are obtained through training and testing. This application effectively improves the performance of the network model and has high accuracy.
【技术实现步骤摘要】
一种维吾尔文手写字母识别方法、系统及电子设备
本申请属于文字识别
,特别涉及一种维吾尔文手写字母识别方法、系统及电子设备。
技术介绍
手写识别是模式识别最典型的应用之一[GaoY,JinL,HeC,etal.HandwritingCharacterRecognitionasaService:ANewHandwritingRecognitionSystemBasedonCloudComputing[J].2011:885-889.]。从最早在邮政和银行服务中应用数字和地址核对,图书馆和博物馆的历史资源的数字化,手写识别一直在办公,自动化和日常通信中收欢迎。目前,它是人机交互式智能设备最流行的属性之一。手写识别有两个主要分支,是联机手写识别和脱机手写识别[LiuCL,YinF,WangDH,etal.OnlineandofflinehandwrittenChinesecharacterrecognition:Benchmarkingonnewdatabases[J].PatternRecognition,2013,46(1):155-162.]。在联机手写识别中,利用在手写过程中记录下来的笔尖轨迹信息对手写体样本进行分类。当然,手写轨迹可以保存下来,在以后的学习和实验中反复使用。脱机手写识别的识别对象是手写文字图像。原始手写样本具有精确的笔尖轨迹,因此包含了空间和时间信息。脱机手写识别利用图像处理技术获取手写样本的空间信息。从已经完成的脱机手写图像中获取时间信息是非常具有挑战性的。形成一个手写字母或文字形状具有高度随机性。一个相同的手写体对象可能是以不同 ...
【技术保护点】
1.一种维吾尔文手写字母识别方法,其特征在于,包括以下步骤:步骤a:收集/读入维吾尔文字母的原始手写样本;步骤b:对所述原始手写样本进行预处理,将所述原始手写样本转换为二值图像;步骤c:将所述二值图像输入卷积神经网络进行分类训练和测试,得到所述原始手写样本的识别结果。
【技术特征摘要】
1.一种维吾尔文手写字母识别方法,其特征在于,包括以下步骤:步骤a:收集/读入维吾尔文字母的原始手写样本;步骤b:对所述原始手写样本进行预处理,将所述原始手写样本转换为二值图像;步骤c:将所述二值图像输入卷积神经网络进行分类训练和测试,得到所述原始手写样本的识别结果。2.根据权利要求1所述的维吾尔文手写字母识别方法,其特征在于,在所述步骤a中,所述收集/读入维吾尔文字母的原始手写样本,具体为:通过手写板记录的包括维吾尔文字母的128种书写形式的联机手写样本,所述联机手写样本信息包括维吾尔文字母的Unicode编码、总笔画数、字母中各笔划轨迹结束标志,字母轨迹总结束标志以及每个点的坐标信息。3.根据权利要求2所述的维吾尔文手写字母识别方法,其特征在于,在所述步骤b中,所述对所述原始手写样本进行预处理,将所述原始手写样本转换为二值图像具体包括:步骤b1:对每个原始手写样本的笔划轨迹分别进行点插入操作,新插入点的坐标计算公式为:上式中,(xi,yi)是第i个插入点的坐标,ΔX和ΔY分别表示水平和垂直方向上的的距离,该距离的正整数N为需要插入的点数;步骤b2:对原始手写样本进行坐标范围归一化;坐标归一化后的新点坐标计算公式为:上式中,(W,H)代表原始坐标范围虚拟窗口的宽度和高度,(X,Y)是原始点坐标值,(w,h)是归一化后坐标范围虚拟窗口的宽度和高度,(x,y)是归一化后的点坐标;为了避免信息丢失本发明保持了原始的手写样本轨迹范围不变,即横坐标和纵坐标的取值范围都是[1,255].步骤b3:根据归一化后的坐标范围对原始手写样本进行尺寸调整。4.根据权利要求3所述的维吾尔文手写字母识别方法,其特征在于,在所述步骤b3中,所述根据归一化后的坐标范围对原始手写样本进行尺寸调整具体包括:步骤b3a:计算原始手写样本的宽度和高度对于归一化后坐标范围所形成的虚拟窗口的宽度比例和高度比例;步骤b3b:根据所述宽度比例和高度比例计算样本尺寸调整比例,并根据样本尺寸调整比例将原始手写样本调整到归一化的坐标范围;步骤b3c:将调整后的样本轨迹移到归一化后坐标范围虚拟窗口的中心;步骤b3d:将尺寸调整后的原始手写样本转换成二值图像。5.根据权利要求1至4任一项所述的维吾尔文手写字母识别方法,其特征在于,在所述步骤c中,所述卷积神经网络包括5个卷积层、5个池化层、3个全连接层和softmax分类器,所述5个卷积层用于提取二值图像的特征图,所述5个池化层用于将卷积层提取的特征图的大小减半,所述3个全连接层用于对特征图进行全局组合后输入softmax分类器,所述softmax分类器用于根据特征图对原始手写样本进行分类,得到所述原始手写样本的识别结果。6.一种维吾尔文手写字母识别系统,其特征在于,包括:样本收集/读入模块:用于收集/读入维吾尔文字母的原始手写样本;样本预处理模块:用于对所述原始手写...
【专利技术属性】
技术研发人员:艾斯卡尔·艾木都拉,吾加合买提·司马义,玛依热·依布拉音,
申请(专利权)人:新疆大学,
类型:发明
国别省市:新疆,65
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。