一种基于模板匹配和BP神经网络的东巴文识别方法技术

技术编号：24614027 阅读：24 留言：0更新日期：2020-06-24 01:25

基于模板匹配和BP神经网络的东巴文识别方法，由如下步骤构成，1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤；步骤1)中，图片预处理包括二值化、图片去噪和细化处理；图片指直接通过拍照或扫描得到的东巴文彩色图片；步骤2)特征提取包括归一化和笔划特征提取；端点位置特征的提取：计算图片中每一个像素点的以8邻域寻找相邻像素点的个数，仅保留相邻像素点的个数为0或1的像素点；确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置，将重心位置的坐标作为端点位置特征；步骤3)模板匹配的方法，利用改进后的豪斯多夫距离计算样本图片的笔划特征与模板图片的笔划特征之间的距离。

A recognition method of Dongba based on template matching and BP neural network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于模板匹配和BP神经网络的东巴文识别方法
本专利技术涉及一种古文字的识别方法，尤其是东巴文的识别方法。
技术介绍
：东巴文是一种文字形态原始的象形文字。由于学习和使用东巴文的人群数量正在减少，为满足研究和保护东巴文的要求，需要实现计算机对东巴文的自动识别。现有技术方案一般如下或类似的步骤：步骤1、将欲识别图片灰度化，并平滑去噪。步骤2、用投影法和特征点法进行特征提取。步骤3、分别用模板匹配法或高阶神经网络进行识别。现有技术需要大量已识别的东巴文图片样本。由于模板匹配法是基于单一模板进行匹配，在图片噪声的干扰下识别准确率低；由于利用神经网络进行训练需要大量已识别的图片样本，而已识别的东巴文图片数量较少，易出现欠拟合的现象。
技术实现思路
专利技术目的：本专利技术所要解决的技术问题是：准确识别东巴文图片样本内容。通过提出改进技术手段来准确识别包含东巴文文字的图片中的东巴文文字内容。利用东巴文模板和少量样本，准确识别包含东巴文文字的图片的东巴文文字内容，为东巴文研究者提供高效的识别工具。本专利技术的技术方案是，基于模板匹配和BP神经网络的东巴文识别方法，其特征是，由如下步骤构成，1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤；步骤1)中，图片预处理包括二值化、图片去噪和细化处理；图片指直接通过拍照或扫描得到的东巴文彩色图片。1-1)将图片灰度化，用最大类间方差法确定灰度阈值，根据灰度阈值将图片二值化；二值化后的图...

【技术保护点】
1.基于模板匹配和BP神经网络的东巴文识别方法，其特征是，由如下步骤构成，1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤；/n步骤1)中，图片预处理包括二值化、图片去噪和细化处理；图片指直接通过拍照或扫描得到的东巴文彩色图片；/n1-1)将图片灰度化，用最大类间方差法确定灰度阈值，根据灰度阈值将图片二值化；二值化后的图片被称为二值图片，二值图片由像素点“0”、即图片中的空白像素和像素点“1”、即构成笔划的黑色像素构成；“像素点”未特殊说明时即指像素点“1”；/n1-2)对图片做闭操作处理，删除面积小于面积阈值的连通区域；闭操作：第一步，遍历二值图片的全部像素，将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”，将全部图片边缘像素点修改为像素点“1”；第二步，重新遍历图片并标记图片边缘像素点，将全部图片边缘像素点修改为为像素点“0”；/n删除面积小于阈值的连通区域：连通区域指二值图片中以8连通寻找位置相邻的像素点“1”组成的图片区域，连通区域的面积等于像素点“1”的个数；遍历二值图片的全部像素，标记每一个连通区域的位置和面积；将每一个面积小于面积阈值的...

【技术特征摘要】
1.基于模板匹配和BP神经网络的东巴文识别方法，其特征是，由如下步骤构成，1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤；
步骤1)中，图片预处理包括二值化、图片去噪和细化处理；图片指直接通过拍照或扫描得到的东巴文彩色图片；
1-1)将图片灰度化，用最大类间方差法确定灰度阈值，根据灰度阈值将图片二值化；二值化后的图片被称为二值图片，二值图片由像素点“0”、即图片中的空白像素和像素点“1”、即构成笔划的黑色像素构成；“像素点”未特殊说明时即指像素点“1”；
1-2)对图片做闭操作处理，删除面积小于面积阈值的连通区域；闭操作：第一步，遍历二值图片的全部像素，将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”，将全部图片边缘像素点修改为像素点“1”；第二步，重新遍历图片并标记图片边缘像素点，将全部图片边缘像素点修改为为像素点“0”；
删除面积小于阈值的连通区域：连通区域指二值图片中以8连通寻找位置相邻的像素点“1”组成的图片区域，连通区域的面积等于像素点“1”的个数；遍历二值图片的全部像素，标记每一个连通区域的位置和面积；将每一个面积小于面积阈值的连通区域的所有像素点“1”修改为像素点“0”；
1-3)用罗森菲尔德细化算法对图片做细化处理，得到东巴文文字骨架图片；
细化算法：遍历二值图片的全部像素，将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”；若将某一个边缘像素点“1”修改为为像素点“0”的操作不会增加以8连通寻找连通区域的个数，则执行此操作；对全部图片边缘像素点执行以上操作称为一次“细化”，反复执行“细化”直到没有能够修改的像素点则停止“细化”；
2)特征提取包括归一化和笔划特征提取；
2-1)归一化的方法，计算图片的重心位置、横向标准差和纵向标准差，对图片进行平移和缩放，使得图片重心与图片中心重合，横向标准差和纵向标准差为固定值；
2-2)笔划特征提取的方法，笔划特征包括笔划的连通块位置特征、笔划的封闭块位置特征、笔划的端点位置特征、笔划的交点位置特征和笔划的连线位置特征；
步骤2-2)中，笔划的连通块位置特征的提取：确定笔划的图片中以8连通寻找每一个连通区域的重心位置，将重心位置的坐标作为连通块位置特征；
封闭块位置特征的提取：对图片做非运算，再确定图片中以4连通寻找每...

【专利技术属性】
技术研发人员：庄建军，夏一飞，魏世桓，沈祎辰，赵一鸣，王昀牧，申彤，黎文斯，张鑫，杨鸿荣，杨继琼，张志俭，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人