【技术实现步骤摘要】
一种实现对手写体字符拒识的方法
本专利技术涉及手写体字符识别领域,具体涉及一种实现对手写体字符拒识的方法。
技术介绍
随着模式识别和人工智能技术的发展,手写文本机器识别技术得到了有效的应用,同时相关的理论、技术、方法也得到了很大的发展,手写体字符识别技术作为手写文本识别技术的基础功能模块更是得到了广泛关注和大力研究。手写体字符识别问题在本质上是一个分类问题,每一个识别系统有其支持的字符集,手写体字符识别的算法需要确定一个手写字符笔迹属于字符集中的哪一类字符,并在大多数的情况下给出一个可信度分值。在现今,得益于机器学习和深度学习的发展,基于支持向量机(SupportVectorMechine,SVM)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)等方法手写体字符识别的准确率达到了历史的高度,在某些测试中甚至超过了人类的识别水平。然而,当有不属于系统支持字符集中的字符笔迹或者根本不是一个有意义的字符笔迹输入到识别算法中时,识别算法往往以高置信度分值把它分类为字符集中的某一个字符,这样的结果显然是荒谬的;在现有手写体字符识别过程中,其解决 ...
【技术保护点】
一种实现对手写体字符拒识的方法,其特征在于,包括以下步骤:a、采集手写笔迹数据,并对所采集的手写笔迹数据进行训练处理,获取训练笔迹数据;b、建立堆栈式RBN神经网络,并读取步骤a中训练笔迹数据,对模型进行搭建、训练和保存;c、读取步骤a中的训练笔迹数据和步骤b中的模型,并根据模型计算出训练笔迹数据的重构误差数据;d、重复多次步骤c,得到重构误差数据集合R,通过计算重构误差数据集合R,获取置信区间,并保存该置信区间数据;e、输入新的手写笔迹数据,并计算出新的手写笔迹数据的重构误差,通过判断该重构误差是否在步骤d的置信区间内来确定是否拒识该新的手写笔迹数据。
【技术特征摘要】
1.一种实现对手写体字符拒识的方法,其特征在于,包括以下步骤:a、采集手写笔迹数据,并对所采集的手写笔迹数据进行训练处理,获取训练笔迹数据;b、建立堆栈式RBN神经网络,并读取步骤a中训练笔迹数据,对模型进行搭建、训练和保存;c、读取步骤a中的训练笔迹数据和步骤b中的模型,并根据模型计算出训练笔迹数据的重构误差数据;d、重复多次步骤c,得到重构误差数据集合R,通过计算重构误差数据集合R,获取置信区间,并保存该置信区间数据;e、输入新的手写笔迹数据,并计算出新的手写笔迹数据的重构误差,通过判断该重构误差是否在步骤d的置信区间内来确定是否拒识该新的手写笔迹数据。2.根据权利要求1所述的实现对手写体字符拒识的方法,其特征在于,所述步骤a包括以下步骤:a1、获取笔迹点坐标序列Tl,并求得Tl的最大纵坐标值h和最大横坐标值w;a2、根据笔迹点坐标序列Tl的最大纵坐标值h和最大横坐标值w,计算出放缩比例ShrinkageRatio,并根据该放缩比例ShrinkageRatio将笔迹点放缩到横、纵坐标均为参数Len的二维矩阵M中;a3、当放缩比例ShrinkageRatio大于1时,对放大后笔迹点之间的空隙进行填充,得到多个二维矩阵M的坐标数据;a4、将二维矩阵M按行依次拼接为一个长度为Len*Len的向量Vo。3.根据权利要求2所述的实现对手写体字符拒识的方法,其特征在于,所述步骤a1包括以下步骤:a11、判断手写笔迹数据的呈现形式是图片还是一系列的笔迹坐标点,如果是图片,则进入步骤a12;如果是一系列的笔迹坐标点Tp,则直接进入步骤a15;a12、判断图片是彩色RRG三通道图像还是单通道灰度图像Io,如果是彩色RRG三通道图像,则将其转换成单通道灰度图像Io,并进入步骤a13;如果是单通道灰度图像Io,则直接进入步骤a13;a13、根据OTSU算法对单通道灰度图像Io进行阈值分隔,形成二值图像Ir;且当笔迹像素点为白色时,取Ir=1-Ir;a14、根据追踪算法在二值图像Ir中追踪达到一定长度的、连续的,且在一定宽度范围内的黑色像素点,并将该黑色像素点的坐标位置记录到坐标点序列Tp中;a15、求得坐标点序列Tp中坐标的最小纵坐标值和最小横坐标值,并将该坐标点序列Tp中的坐标对应减去该最小纵坐标值和最小横坐标值,得到笔迹点坐标序列Tl;a16、根据笔迹点坐标序列Tl,求得该笔迹点坐标序列Tl的最大纵坐标值h和最大横坐标值w。4.根据权利要求2所述的实现对手写体字符拒识的方法,其特征在于,所述步骤a2包括以下步骤:a21、根据笔迹点坐标序列Tl的最大纵坐标值h和最大横坐标值w,取最大纵坐标值h、最大横坐标值w的长边值W_l以及最大横坐标值w的短边值W_s;a22、计算放缩比例其中,margin为边框宽度参数值;a23、计算短边方向起始偏移长度Offset=(Len-W_s×ShrinkageRatio)//2,其中,//表示除以并向下取整;a24、根据放缩比例ShrinkageRatio和短边方向起始偏移长度Offset对笔迹点坐标序列Tl进行放缩,得到放缩序列Tz;a25、遍历笔迹点坐标序列Tl,定义当前坐标点P(x,y),获取放缩映射后的坐标点P_z(x_z,y_z);其中:x_z=x×ShrinkageRatio+Offset_x;y_z=y×ShrinkageRatio+Offset_y;当y>x时,则Offset_x=Offset,Offset_y=0;反之,则Offset_x=0,Off...
【专利技术属性】
技术研发人员:林辉,
申请(专利权)人:成都准星云学科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。