当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于模板匹配和BP神经网络的东巴文识别方法技术

技术编号:24614027 阅读:24 留言:0更新日期:2020-06-24 01:25
基于模板匹配和BP神经网络的东巴文识别方法,由如下步骤构成,1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤;步骤1)中,图片预处理包括二值化、图片去噪和细化处理;图片指直接通过拍照或扫描得到的东巴文彩色图片;步骤2)特征提取包括归一化和笔划特征提取;端点位置特征的提取:计算图片中每一个像素点的以8邻域寻找相邻像素点的个数,仅保留相邻像素点的个数为0或1的像素点;确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为端点位置特征;步骤3)模板匹配的方法,利用改进后的豪斯多夫距离计算样本图片的笔划特征与模板图片的笔划特征之间的距离。

A recognition method of Dongba based on template matching and BP neural network

【技术实现步骤摘要】
一种基于模板匹配和BP神经网络的东巴文识别方法
本专利技术涉及一种古文字的识别方法,尤其是东巴文的识别方法。
技术介绍
:东巴文是一种文字形态原始的象形文字。由于学习和使用东巴文的人群数量正在减少,为满足研究和保护东巴文的要求,需要实现计算机对东巴文的自动识别。现有技术方案一般如下或类似的步骤:步骤1、将欲识别图片灰度化,并平滑去噪。步骤2、用投影法和特征点法进行特征提取。步骤3、分别用模板匹配法或高阶神经网络进行识别。现有技术需要大量已识别的东巴文图片样本。由于模板匹配法是基于单一模板进行匹配,在图片噪声的干扰下识别准确率低;由于利用神经网络进行训练需要大量已识别的图片样本,而已识别的东巴文图片数量较少,易出现欠拟合的现象。
技术实现思路
专利技术目的:本专利技术所要解决的技术问题是:准确识别东巴文图片样本内容。通过提出改进技术手段来准确识别包含东巴文文字的图片中的东巴文文字内容。利用东巴文模板和少量样本,准确识别包含东巴文文字的图片的东巴文文字内容,为东巴文研究者提供高效的识别工具。本专利技术的技术方案是,基于模板匹配和BP神经网络的东巴文识别方法,其特征是,由如下步骤构成,1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤;步骤1)中,图片预处理包括二值化、图片去噪和细化处理;图片指直接通过拍照或扫描得到的东巴文彩色图片。1-1)将图片灰度化,用最大类间方差法确定灰度阈值,根据灰度阈值将图片二值化;二值化后的图片被称为二值图片,二值图片由像素点“0”(即图片中的空白像素)和像素点“1”(即构成笔划的黑色像素)构成。下文“像素点”未特殊说明时即指像素点“1”。1-2)对图片做闭操作处理,删除面积小于面积阈值(阈值可根据情况设定)的连通区域;闭操作:第一步,遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”,将全部图片边缘像素点修改为像素点“1”。第二步,重新遍历图片并标记图片边缘像素点,将全部图片边缘像素点修改为为像素点“0”。删除面积小于阈值的连通区域:连通区域指二值图片中位置相邻(以8连通寻找)的像素点“1”组成的图片区域,连通区域的面积等于像素点“1”的个数。遍历二值图片的全部像素,标记每一个连通区域的位置和面积。将每一个面积小于面积阈值(8-16个像素点)的连通区域的所有像素点“1”修改为像素点“0”。1-3)用罗森菲尔德细化算法对图片做细化处理,得到东巴文文字骨架图片。细化算法:遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”。若将某一个边缘像素点“1”修改为为像素点“0”的操作不会增加连通区域的个数(以8连通寻找),则执行此操作。对全部图片边缘像素点执行以上操作称为一次“细化”,反复执行“细化”直到没有能够修改的像素点则停止“细化”。以n连通寻找:n可以是4或8。4连通指某个像素点“1”的上、下、左、右的四个像素点“1”被认为与之相邻。8连通指某个像素点“1”的上、下、左、右、左上、左下、右上、右下的四个像素点“1”被认为与之相邻。2)特征提取包括归一化和笔划特征提取;2-1)归一化的方法,计算图片的重心位置、横向标准差和纵向标准差,对图片进行平移和缩放,使得图片重心与图片中心重合,横向标准差和纵向标准差为固定值;2-2)笔划特征提取的方法,笔划特征包括笔划的连通块位置特征、笔划的封闭块位置特征、笔划的端点位置特征、笔划的交点位置特征和笔划的连线位置特征;步骤2-2)中,笔划的连通块位置特征的提取:确定笔划的图片中每一个连通区域的重心位置(以8连通寻找),将重心位置的坐标作为连通块位置特征。封闭块位置特征的提取:对图片做非运算,再确定图片中每一个连通区域的重心位置(以4连通寻找),将重心位置的坐标作为封闭块位置特征;非运算:指将像素点“1”修改为像素点“0”,将像素点“0”修改为像素点“1”。端点位置特征的提取:计算图片中每一个像素点的相邻像素点的个数(以8邻域寻找),仅保留相邻像素点的个数为0或1的像素点。确定这些像素点构成的图片中每一个连通区域的重心位置(以8连通寻找),将重心位置的坐标作为端点位置特征;交点位置特征的提取:计算图片中每一个像素点的相邻像素点的个数(以8邻域寻找),仅保留相邻像素点的个数大于2的像素点;确定这些像素点构成的图片中每一个连通区域的重心位置(以8连通寻找),将重心位置的坐标作为交点位置特征;连线位置特征的提取:计算图片中每一个像素点的相邻像素点的个数(以8邻域寻找),仅保留相邻像素点的个数等于2的像素点。确定这些像素点构成的图片中每一个连通区域的重心位置(以8连通寻找),将重心位置的坐标作为连线位置特征。特征提取包括归一化和笔划特征提取;笔划特征提取、特征向量的构成、样本图片特征与模板图片特征之间距离计算的方法3)模板匹配的方法利用改进后的豪斯多夫距离计算样本图片的笔划特征与模板图片的笔划特征之间的距离:对于每一种笔划特征,分别可以得到样本图片的位置特征对应的坐标集合为A={(x1,y1),(x2,y2),...,(xn,yn)},而欲匹配的模板图片的位置特征对应的坐标集合为B={(x′1,y′1),(x′2,y′2),...,(x′m,y′m)}。根据改进后的豪斯多夫距离,样本图片的笔划特征与模板图片的笔划特征之间的距离为:其中a,b分别是A,B中的坐标点。4)、神经网络处理的方法将样本图片与全部东巴文模板图片做模板匹配的距离按固定顺序排列为一个列向量。对每一种笔划特征进行该操作,共得到5个维度相同的列向量,记为{X1,X2,X3,X4,X5},即特征向量。将特征向量送入BP神经网络进行训练。神经网络设置了两层隐藏层。输出层使用归一化指数函数进行分类操作。神经网络执行前向传播时,首先对同一个列向量中的各个元素分配不同的权值,然后进入全连接层并输出;神经网络执行反向传播时,更新参数矩阵的权值。利用梯度下降算法,选择合适的学习率,利用一定量的东巴文图片样本进行训练。当损失函数收敛至较小值时,保存神经网络的权值矩阵。权值矩阵即神经网络保存的训练数据。当神经网络需要识别新的图片样本时,需要读取并调用该权值矩阵从而实现准确的识别。本专利技术包括{笔划特征提取、特征向量的构成、样本图片特征与模板图片特征之间距离计算的方法:1、利用罗森菲尔德细化算法获取东巴文文字骨架的方法,2、对包含东巴文的图片进行归一化的方法;3、提取文字图片笔划特征的方法;4、利用改进后的豪斯多夫距离计算样本图片特征和模板图片特征之间距离的方法;5、将模板匹配得到的特征向量通过BP神经网络进行训练的方法。有益效果:由于本方法通过罗森菲尔德细化算法提取东巴文文字的骨架,能够消除文字笔划粗细对识别率的影响;由于本方法是基于笔划特征对东巴文图片进行特征提取,提高本文档来自技高网...

【技术保护点】
1.基于模板匹配和BP神经网络的东巴文识别方法,其特征是,由如下步骤构成,1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤;/n步骤1)中,图片预处理包括二值化、图片去噪和细化处理;图片指直接通过拍照或扫描得到的东巴文彩色图片;/n1-1)将图片灰度化,用最大类间方差法确定灰度阈值,根据灰度阈值将图片二值化;二值化后的图片被称为二值图片,二值图片由像素点“0”、即图片中的空白像素和像素点“1”、即构成笔划的黑色像素构成;“像素点”未特殊说明时即指像素点“1”;/n1-2)对图片做闭操作处理,删除面积小于面积阈值的连通区域;闭操作:第一步,遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”,将全部图片边缘像素点修改为像素点“1”;第二步,重新遍历图片并标记图片边缘像素点,将全部图片边缘像素点修改为为像素点“0”;/n删除面积小于阈值的连通区域:连通区域指二值图片中以8连通寻找位置相邻的像素点“1”组成的图片区域,连通区域的面积等于像素点“1”的个数;遍历二值图片的全部像素,标记每一个连通区域的位置和面积;将每一个面积小于面积阈值的连通区域的所有像素点“1”修改为像素点“0”;/n1-3)用罗森菲尔德细化算法对图片做细化处理,得到东巴文文字骨架图片;/n细化算法:遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”;若将某一个边缘像素点“1”修改为为像素点“0”的操作不会增加以8连通寻找连通区域的个数,则执行此操作;对全部图片边缘像素点执行以上操作称为一次“细化”,反复执行“细化”直到没有能够修改的像素点则停止“细化”;/n2)特征提取包括归一化和笔划特征提取;/n2-1)归一化的方法,计算图片的重心位置、横向标准差和纵向标准差,对图片进行平移和缩放,使得图片重心与图片中心重合,横向标准差和纵向标准差为固定值;/n2-2)笔划特征提取的方法,笔划特征包括笔划的连通块位置特征、笔划的封闭块位置特征、笔划的端点位置特征、笔划的交点位置特征和笔划的连线位置特征;/n步骤2-2)中,笔划的连通块位置特征的提取:确定笔划的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为连通块位置特征;/n封闭块位置特征的提取:对图片做非运算,再确定图片中以4连通寻找每一个连通区域的重心位置,将重心位置的坐标作为封闭块位置特征;/n非运算:指将像素点“1”修改为像素点“0”,将像素点“0”修改为像素点“1”;/n端点位置特征的提取:计算图片中每一个像素点的以8邻域寻找相邻像素点的个数,仅保留相邻像素点的个数为0或1的像素点;确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为端点位置特征;/n交点位置特征的提取:计算图片中每一个像素点的以8邻域寻找相邻像素点的个数,仅保留相邻像素点的个数大于2的像素点;确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为交点位置特征;/n连线位置特征的提取:计算图片中以8邻域寻找每一个像素点的相邻像素点的个数,仅保留相邻像素点的个数等于2的像素点;确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为连线位置特征;/n特征提取包括归一化和笔划特征提取;/n3)模板匹配的方法/n利用改进后的豪斯多夫距离计算样本图片的笔划特征与模板图片的笔划特征之间的距离:对于每一种笔划特征,分别可以得到样本图片的位置特征对应的坐标集合为A={(x...

【技术特征摘要】
1.基于模板匹配和BP神经网络的东巴文识别方法,其特征是,由如下步骤构成,1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤;
步骤1)中,图片预处理包括二值化、图片去噪和细化处理;图片指直接通过拍照或扫描得到的东巴文彩色图片;
1-1)将图片灰度化,用最大类间方差法确定灰度阈值,根据灰度阈值将图片二值化;二值化后的图片被称为二值图片,二值图片由像素点“0”、即图片中的空白像素和像素点“1”、即构成笔划的黑色像素构成;“像素点”未特殊说明时即指像素点“1”;
1-2)对图片做闭操作处理,删除面积小于面积阈值的连通区域;闭操作:第一步,遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”,将全部图片边缘像素点修改为像素点“1”;第二步,重新遍历图片并标记图片边缘像素点,将全部图片边缘像素点修改为为像素点“0”;
删除面积小于阈值的连通区域:连通区域指二值图片中以8连通寻找位置相邻的像素点“1”组成的图片区域,连通区域的面积等于像素点“1”的个数;遍历二值图片的全部像素,标记每一个连通区域的位置和面积;将每一个面积小于面积阈值的连通区域的所有像素点“1”修改为像素点“0”;
1-3)用罗森菲尔德细化算法对图片做细化处理,得到东巴文文字骨架图片;
细化算法:遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”;若将某一个边缘像素点“1”修改为为像素点“0”的操作不会增加以8连通寻找连通区域的个数,则执行此操作;对全部图片边缘像素点执行以上操作称为一次“细化”,反复执行“细化”直到没有能够修改的像素点则停止“细化”;
2)特征提取包括归一化和笔划特征提取;
2-1)归一化的方法,计算图片的重心位置、横向标准差和纵向标准差,对图片进行平移和缩放,使得图片重心与图片中心重合,横向标准差和纵向标准差为固定值;
2-2)笔划特征提取的方法,笔划特征包括笔划的连通块位置特征、笔划的封闭块位置特征、笔划的端点位置特征、笔划的交点位置特征和笔划的连线位置特征;
步骤2-2)中,笔划的连通块位置特征的提取:确定笔划的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为连通块位置特征;
封闭块位置特征的提取:对图片做非运算,再确定图片中以4连通寻找每...

【专利技术属性】
技术研发人员:庄建军夏一飞魏世桓沈祎辰赵一鸣王昀牧申彤黎文斯张鑫杨鸿荣杨继琼张志俭
申请(专利权)人:南京大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1