本发明专利技术公开了一种基于交点数判定手写数字的方法,包括以下步骤:S1、将手写的数字信息以图像形式保存至计算机上,并初始化为灰度图像;S2、采用中值滤波法消除图像中的噪声;S3、将灰度图像处理成数字图像;S4、在数字图像中上到下作3~5根垂直线,根据垂直线与数字图像之间的交点数,确定数字值;S5、对于交点数相同的多个图像,对每个数字从左到右作三根水平线,根据水平线与数字图像之间的交点数,确认数字值。本发明专利技术提出了一种简单、快速的脱机识别手写体数字的方法,通过对垂直线与手写字符相交的交点个数进行判定,可准确识别数字值;当多个数字交点相同,不能从垂直交点数上区分数字时,再辅之以横向切割交点数计算,可唯一确定数字值。
【技术实现步骤摘要】
一种基于交点数判定手写数字的方法
本专利技术属于计算机人工智能
,特别涉及一种基于交点数判定手写数字的方法。
技术介绍
当今,计算机飞速发展,我们的生活、工作和学习已经越来越离不开计算机了,但是,就目前来看,我们仍然离不开图片书本、录像声音以及手写文字,而且如今我们要求计算机识别这些图像、声音和文字,如对邮政编码、财务报表、银行票据和一些调查数据的识别,因此,如何让计算机准确地识别手写的数字,具有广泛的应用前景。手写体数字识别可以分为联机手写体数字识别和脱机手写体数字识别两种,手机、平板电脑等设备的手写输入法属于联机手写模式,因为联机手写体数字识别在输入的过程中有笔画和笔顺数等信息的录入,所以,联机手写体数字的识别也较脱机手写体数字识别容易一些,其研究成果也比较成熟,而本专利技术专注于脱机识别已经写好的手机体数字。手写体数字识别是我们很熟悉的光学字符识别技术(其英文缩写为OCR)的一个分支,是光学字符识别中很常见的一个比较重要的问题,科学技术迅猛发展,光学字符识别也有了重要的理论价值以及实用价值,怎样利用计算机来自动辨认人类手写在纸张上的阿拉伯数字就是光学字符识别研究的主要对象。目前,比较主流的识别方法包括:(1)模版匹配法,对每个模式类先定义一个标准的模式,而且将这个模式定为此模式类的一个模板,在识别字符的时候,将待识别字符与所有定好的模板进行比较,最后所得差别最小模板的所属类型即可认为是待识别字符所属于的类别。模板匹配法具有原理简单、易于实现的有点,但是模板匹配法的要求标准比较高,它要求有稳定的模板,因此,模板匹配法一般只适用于印刷体字符或者受一定限制的手写体字符,针对具有随意性的手写体字符,模板匹配法很难适用。(2)统计决策法,统计决策法以概率论和数理统计为基础,提取待识别模式的一组统计特征,之后进行判决,达到分类目的。判决时候的决策函数具有一定的相关准则。统计决策法有比较严格的数学基础,在识别字符的模式识别中,用严格的数学计算来实现识别字符的,其最终也归结于分类问题。Bayes法则是统计决策法的一个很好的代表。统计决策法有抗噪声干扰能力非常强的优点,但是抽取好的特征比较困难是其缺点之一,它的另一缺点是不能表现比较精细的模式结构特征。几何分类法是统计决策法的另一个很直观的形式,其基本原理就是把特征向量当作是特征空间里面的一个点,先找出几何分离函数,再把这些点进行分离,最后完成分类任务,这一方法有个前提,就是确定特征点在特征空间中是可分的。假如不是同一类样本的聚类空间有重叠现象的发生,那么寻找分离函数的这一个迭代过程就不会达到收敛,这时也就不能完成分类识别。(3)逻辑推理法,以人工智能为基础的字符判别方法叫逻辑推理法,它的基本思想就是先用知识对每个模式类进行描述,再运用知识库中的一系列规则对其进行推理,从而得到了不同的结果,并且每一个结果都会有与其相应的模式。逻辑推理法也有其缺点,就是很难识别出数字字符“1”。(4)模糊判别法,用模糊集合来表示模式类,用隶属度将模糊集合分成若干个子集,子集的总数和模式类别的总数是一样的,然后根据就近原则进行分类,模糊判别法的理论基础是模糊数学,因为函数中的隶属度未知样本与标准模式间的相类似程度度量了,因此,模糊判别法能够反映出数字字符模式的整体特征结构,这就允许待识别数字字符可以有一定的干扰以及变形,可是,在模糊判别前建立一个合理的隶属函数是个比较困难的问题。(5)神经网络法,先让神经网络对每个模式类别中的样本进行学习,再通过神经网络的学习以及记忆能力记住每个模式类别里的样本特征,在识别待识字符的时候,通过网络回忆以前记住的每个模式类别特征,并且把它们一一与待识样本特征进行比较,从而判断样本属于哪一个模式类别。网络输入的是字符的特征向量,网络的输出是字符的识别结果。因为识别策略有所不同,对问题的理解水平也有一定限制,所以网络输入的特征向量里经常包含比较冗余的信息,有时候几乎是相互矛盾的。在经过多次的反复学习之后,神经网络可以自动消除所谓的冗余和互相矛盾的信息,将特征向量优化,做到强化类间的不同地方。而且,神经网络的网络结构是具有分布式的,它能够加快一些大规模问题的求解速度,因为它具有可以并行的条件。神经网络法也具有抗干扰能力强的优点,并且待识别样本可以有较大一些的变化,但是它对特征向量的选取有较高的要求。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种通过设置垂线与手写字符相交,并对交点个数进行判定,可准确识别数字值;当多个数字出现交点相同,不能从垂直交点数上区分数字时,再辅之以横向切割交点数计算,可唯一确定数字值的基于交点数判定手写数字的方法。本专利技术的目的是通过以下技术方案来实现的:一种基于交点数判定手写数字的方法,包括以下步骤:S1、手写数字电子化:将手写的数字信息以图像形式保存至计算机上,图像文件格式可以为jpg、png或bmp等格式,并去除图像的颜色信息,初始化图像为灰度图像;S2、消除噪声:在图像扫描或拍照过程中,由于光线或其它原因,可能在图像中存在一些随机的噪声(孤立的、较小的像素块),必须去除;采用中值滤波的方法消除灰度图像中的噪声;S3、进行二值化处理:也就是改变图像的灰度级,根据图像中像素的灰度值,将灰度图像处理成仅包括黑、白两种颜色的数字图像;S4、基于垂直交点,判定数字值:在数字图像中针对每个数字从上到下作3~5根垂直线,根据垂直线与数字图像之间的交点数,确定数字值;S5、对于垂直线与数字图像之间的交点数相同的多个数字图像,在数字图像中再针对每个数字从左到右作三根水平线,根据水平线与数字图像之间的交点数,确认最终数字值。进一步地,步骤S1的灰度图像用点矩阵表示为:其中,m×n为图像分辨率,每个坐标(i,j)表示一个独立的像素点,其灰度值用f(i,j)表示,f(i,j)大于等于设定的阈值的,则该像素点为笔划部分;f(i,j)小于设定的阈值的,则该像素点为白色背景,f(i,j)∈[0,255]。进一步地,步骤S2具体实现方法为:将一个n×n大小的模板从上到下从左到右在图像上进行移动,将这个模板移动到各个像素上,对每个像素使用n×n模板,使得所有的像素灰度值的中间值取代当前像素的灰度值:其中,n=3或5;模板大小不同,会造成滤波器滤波效果的不同,所达到的去噪效果也就不一样,对于3x3的滤波器,图像中任一点M的灰度等于其领域内9个像素灰度值的中间值:A0A1A2A3MA4A5A6A7进一步地,步骤S3的具体实现方法为:将所提取的图像的矩阵转化为只由0和l表示的二值像素矩阵形式,即f(i,j)=0或f(i,j)=1;设定一个阈值t∈(0,255),得到二值化后的矩阵表达式为:重新设置C={g(i,j)}为二值化后的图形矩阵,二值化后,使得图像将呈现白底黑字的效果,为后续处理奠定基础。进一步地,步骤S4具体实现方法包括以下子步骤:S41、探测图像最左和最右的像素点,作为图像边界;S42、查询使得g(i,j)=1的最小和最大的j值,分别记为jmin和jmax,计算中点值jm=(jmax-jmin)/2,这就是中间垂线的位置,计算左边垂线的位置为jleft=(jm-jmin)/2,右边垂线位置为jright=(jmax-jm)/2;分别在本文档来自技高网...
【技术保护点】
一种基于交点数判定手写数字的方法,其特征在于,包括以下步骤:S1、手写数字电子化:将手写的数字信息以图像形式保存至计算机上,并去除图像的颜色信息,初始化图像为灰度图像;S2、消除噪声:采用中值滤波的方法消除灰度图像中的噪声;S3、进行二值化处理:根据图像中像素的灰度值,将灰度图像处理成仅包括黑、白两种颜色的数字图像;S4、基于垂直交点,判定数字值:在数字图像中针对每个数字从上到下作3~5根垂直线,根据垂直线与数字图像之间的交点数,确定数字值;S5、对于垂直线与数字图像之间的交点数相同的多个数字图像,在数字图像中再针对每个数字从左到右作三根水平线,根据水平线与数字图像之间的交点数,确认最终数字值。
【技术特征摘要】
1.一种基于交点数判定手写数字的方法,其特征在于,包括以下步骤:S1、手写数字电子化:将手写的数字信息以图像形式保存至计算机上,并去除图像的颜色信息,初始化图像为灰度图像;S2、消除噪声:采用中值滤波的方法消除灰度图像中的噪声;S3、进行二值化处理:根据图像中像素的灰度值,将灰度图像处理成仅包括黑、白两种颜色的数字图像;S4、基于垂直交点,判定数字值:在数字图像中针对每个数字从上到下作3~5根垂直线,根据垂直线与数字图像之间的交点数,确定数字值;具体实现方法为:S41、探测图像最左和最右的像素点,作为图像边界;S42、查询使得g(i,j)=1的最小和最大的j值,分别记为jmin和jmax,计算中点值jm=(jmax-jmin)/2,这就是中间垂线的位置,计算左边垂线的位置为jleft=(jm-jmin)/2,右边垂线位置为jright=(jmax-jm)/2;分别在jleft、jm和jright三个位置,各引一根垂直线;或者在jleft、jm和jright三个位置各引一根垂直线,以及jleft和jm之间或者jm和jright之间任意位置引一根垂直线;或者在jleft、jm和jright三个位置各引一根垂直线,以及在jleft和jm之间任意位置、jm和jright之间任意位置,分别各引一根垂直线;然后根据垂直线与数字的交点的个数判断数字值;S5、对于垂直线与数字图像之间的交点数相同的多个数字图像,在数字图像中再针对每个数字从左到右作三根水平线,根据水平线与数字图像之间的交点数,确认最终数字值。2.根据权利要求1所述的基于交点数判定手写数字的方法,其特征在于,所述步骤S1的灰度图像用点矩阵表示为:其中,m×n为图像分辨率,每个坐标(i,j)表示一个独立的像素点,其灰度值用f(i,j)表示...
【专利技术属性】
技术研发人员:唐雪飞,陈科,马晨曦,
申请(专利权)人:成都康赛信息技术有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。