当前位置: 首页 > 专利查询>西南大学专利>正文

基于深度学习的甲骨文偏旁的检测与识别方法技术

技术编号:25272053 阅读:22 留言:0更新日期:2020-08-14 23:04
本发明专利技术公开了一种基于深度学习的甲骨文偏旁的检测与识别方法,主要涉及甲骨文识别技术领域。按照以下步骤进行:S1:对甲骨文拓片进行扫描或拍照,获得甲骨文图像;S2:采用最大极值稳定区域算法来筛选甲骨文图像中的甲骨文单偏旁区域;S3:对选定的甲骨文单偏旁区域进行椭圆拟合;S4:采用非极大值抑制算法去除对同一个甲骨文单偏旁多余重复或错误的检测结果,完成甲骨文单偏旁的检测,获得甲骨文单偏旁数据;S5:利用BN‑Lenet网络模型识别甲骨文单偏旁数据。本发明专利技术的有益效果在于:能够获得较高的识别精度,同时将甲骨文视为偏旁组合而非整字识别,能够识别未考释的甲骨文新字,即零样本学习,对甲骨文研究有着重要的应用意义。

【技术实现步骤摘要】
基于深度学习的甲骨文偏旁的检测与识别方法
本专利技术涉及甲骨文识别
,具体是基于深度学习的甲骨文偏旁的检测与识别方法。
技术介绍
甲骨文是迄今为止中国发现的年代最早的成熟文字系统,是汉字的源头和中华优秀传统文化的根脉,但甲骨文考释仍然困难重重,尽管考古学家和古文字学家不断努力,但从计算机视觉角度对甲骨文文字分析的研究却很少,也没有相关的公共数据集,虽然有着一些传统的方法尝试对甲骨文字进行识别,如顾绍通提出的基于拓扑配准的识别方法;周新伦等提出利用图论和笔划特点来识别甲骨文字形的方法;李锋等提出利用图特征的原理来识别甲骨文字形的方法;栗青生等提出利用图同构的方法来识别甲骨文字形,但他们往往只将甲骨文字符作为一个整体来处理,没有考虑不同字符之间的相似性和内部结构,也没有考虑甲骨文中不同构但仍为同一字形的异体字问题,但甲骨文中异体字情况大量存在,因而实用性受到限制。
技术实现思路
本专利技术的目的在于解决现有技术中存在的问题,从甲骨文单偏旁的角度出发,分析组成甲骨文常用的基本结构成分,即偏旁,提供一种基于深度学习的甲骨文偏旁的检测与识别方法,能够获得较高的识别精度,同时将甲骨文视为偏旁组合而非整字识别,能够识别未考释的甲骨文新字,即零样本学习,对甲骨文研究有着重要的应用意义。本专利技术为实现上述目的,通过以下技术方案实现:基于深度学习的甲骨文偏旁的检测与识别方法,按照以下步骤进行:S1:对甲骨文拓片进行扫描或拍照,获得甲骨文图像;S2:采用最大极值稳定区域算法来筛选甲骨文图像中的甲骨文单偏旁区域;S3:对选定的甲骨文单偏旁区域进行椭圆拟合;S4:采用非极大值抑制算法去除对同一个甲骨文单偏旁多余重复或错误的检测结果,完成甲骨文单偏旁的检测,获得甲骨文单偏旁数据;S5:利用BN-Lenet网络模型识别甲骨文单偏旁数据,所述BN-Lenet网络模型包括2个卷积层、2个最大池化层、1个全连接层、1个softmax层、3个批归一化层和1个随机失活层,所述批归一化层位于卷积层与最大池化层之间。优选的,所述步骤S2具体包括:S21:将甲骨文图像转换成灰度图像;S22:在灰度区间[0,255]内的256个不同阈值对灰度图像进行二值化,令Qi表示二值化阈值i对应的二值图像中的某一连通区域,Δ为变化值,当二值化阈值由i变成i+Δ时,连通区域Qi变成Qi+Δ;当二值化阈值由i变成i-Δ时,连通区域Qi变成Qi-Δ;S23:令v(i)表示两个不同阈值间的区域变化值,其中,Qi表示第i个甲骨文单偏旁连通区域的面积,Δ表示微小的阈值变化,当v(i)小于给定阈值时,认为该甲骨文单偏旁区域为最大极值稳定区域。优选的,所述步骤S3具体包括:S31:确定甲骨文单偏旁区域椭圆拟合的重心坐标(xc,yc),其中,m00、m01、m10是以甲骨文单偏旁最大极值稳定区域内的每个点的坐标为样本,计算整个甲骨文单偏旁的极值稳定区域的几何0阶矩和几何1阶矩:m00=∑I(x,y),m01=∑yI(x,y),m10=∑xI(x,y);S32:确定甲骨文单偏旁区域椭圆拟合的长半轴、短半轴、角度,令a表示长半轴,b表示短半轴,θ表示角度,λ1、λ2为中心二阶矩的两个特征值,其中:μ20=∑(x-xc)2I(x,y),μ02=∑(y-yc)2I(x,y),μ11=∑(x-xc)(y-yc)I(x,y)。优选的,所述步骤S4具体包括:S41:将甲骨文单偏旁区域分成N个框,每个框被分类器计算得到的分数为SN,建造一个存放待处理甲骨文单偏旁候选框的集合H,建造一个存放最优甲骨文单偏旁框的集合M,初始化为空集;S42:将所有甲骨文单偏旁候选框的集合H的框进行排序,选出分数最高的甲骨文单选旁候选框m,从集合H移到集合M;S43:遍历甲骨文单偏旁候选框的集合H中的框,分别与候选框m计算交并比,如果高于每个阈值,则认为该甲骨文单偏旁候选框与m重叠,将此框从集合H中去除,以IoU表示交并比,0<IoU<0.5;S44:回到步骤S42进行迭代,直到甲骨文单偏旁候选框的集合H为空,集合M中的框为所需的最优甲骨文单偏旁检测框。优选的,所述IoU=0.25。优选的,所述步骤S5中的批归一化层包括:对有d维的x=(x(1)…x(d))的输入数据的每一个维度进行归一化处理,其中,E[·]和V[·]通过甲骨文单偏旁训练集计算得到。优选的,对网络层的每一个激活函数X(k)引入一组可学习参数γ(k)和β(k)进行变换重构γ(k)和β(k)和原始模型参数一起学习,且通过设置时可以恢复某一层学到的原始甲骨文单偏旁特征。优选的,在所述步骤S5中的Conv1卷积层上添加L2正则,在全连接层和Softmax层添加概率p=0.5的Dropout层,在每个训练epoch中,在前向传播的时候,让某个神经元的激活值以一定的概率p停止工作。对比现有技术,本专利技术的有益效果在于:本申请提供了一种甲骨文单偏旁检测识别框架的设计,受汉字偏旁拆分的启发,从甲骨文合体字拆分的角度来考释甲骨文,通过最大极值稳定区域算法来筛选单偏旁文本区域,再采用非极大值抑制算法进行后处理,由于甲骨文单偏旁字符形状不规则,单偏旁变形较多,导致甲骨文单偏旁特征难以表征,传统汉字文字识别方法未能解决该问题,因此,本申请提供了一种BN-Lenet网络模型,对每个批次的每一个维度进行归一化处理,以此解决数据分布改变和网络收敛较慢的问题,可以有效地学习甲骨文拓片中有判别意义的深度特征,不仅可以对研究甲骨文相关工作者提供帮助,简化他们的数据处理相关工作,将甲骨文人工考释的工作量大大减小,从而使甲骨文研究者将研究精力转向更深的领域,同时也为计算机介入甲骨文考释提供了新思路,即从偏旁的角度来实现甲骨文考释,当有新的甲骨文字出土时,便可利用本申请来识别该新字。附图说明附图1是甲骨文偏旁的检测与识别的框架图;附图2是经过最大极值稳定区域算法、椭圆拟合和非极大值抑制算法后的结果图;附图3是BN-Lenet网络模型图。具体实施方式下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所限定的范围。实施例:如附图1所示,本专利技术所述是基于深度学习的甲骨文偏旁的检测与识别方法,按照以下步骤进行:S1:对甲骨文拓片进行扫描或拍照,获得甲骨文图像,可用相机直接对甲骨文手写拓片或甲骨文扫描拓片进行拍摄;S2:采用最大极值稳定区域算法(MSER)来筛选甲骨文图像中的甲骨文单偏旁区域;S3:对选定的甲骨文单偏旁区域进行椭圆拟合;S4:采用非极大值抑制算法(NMS)去除对同一个甲骨文单偏旁多余重复或错误的检测结果,完本文档来自技高网...

【技术保护点】
1.基于深度学习的甲骨文偏旁的检测与识别方法,其特征在于,按照以下步骤进行:/nS1:对甲骨文拓片进行扫描或拍照,获得甲骨文图像;/nS2:采用最大极值稳定区域算法来筛选甲骨文图像中的甲骨文单偏旁区域;/nS3:对选定的甲骨文单偏旁区域进行椭圆拟合;/nS4:采用非极大值抑制算法去除对同一个甲骨文单偏旁多余重复或错误的检测结果,完成甲骨文单偏旁的检测,获得甲骨文单偏旁数据;/nS5:利用BN-Lenet网络模型识别甲骨文单偏旁数据,所述BN-Lenet网络模型包括2个卷积层、2个最大池化层、1个全连接层、1个softmax层、3个批归一化层和1个随机失活层,所述批归一化层位于卷积层与最大池化层之间。/n

【技术特征摘要】
1.基于深度学习的甲骨文偏旁的检测与识别方法,其特征在于,按照以下步骤进行:
S1:对甲骨文拓片进行扫描或拍照,获得甲骨文图像;
S2:采用最大极值稳定区域算法来筛选甲骨文图像中的甲骨文单偏旁区域;
S3:对选定的甲骨文单偏旁区域进行椭圆拟合;
S4:采用非极大值抑制算法去除对同一个甲骨文单偏旁多余重复或错误的检测结果,完成甲骨文单偏旁的检测,获得甲骨文单偏旁数据;
S5:利用BN-Lenet网络模型识别甲骨文单偏旁数据,所述BN-Lenet网络模型包括2个卷积层、2个最大池化层、1个全连接层、1个softmax层、3个批归一化层和1个随机失活层,所述批归一化层位于卷积层与最大池化层之间。


2.根据权利要求1所述的基于深度学习的甲骨文偏旁的检测与识别方法,其特征在于,所述步骤S2具体包括:
S21:将甲骨文图像转换成灰度图像;
S22:在灰度区间[0,255]内的256个不同阈值对灰度图像进行二值化,令Qi表示二值化阈值i对应的二值图像中的某一连通区域,Δ为变化值,当二值化阈值由i变成i+Δ时,连通区域Qi变成Qi+Δ;当二值化阈值由i变成i-Δ时,连通区域Qi变成Qi-Δ;
S23:令v(i)表示两个不同阈值间的区域变化值,其中,Qi表示第i个甲骨文单偏旁连通区域的面积,Δ表示微小的阈值变化,当v(i)小于给定阈值时,认为该甲骨文单偏旁区域为最大极值稳定区域。


3.根据权利要求1所述的基于深度学习的甲骨文偏旁的检测与识别方法,其特征在于,所述步骤S3具体包括:
S31:确定甲骨文单偏旁区域椭圆拟合的重心坐标(xc,yc),
其中,m00、m01、m10是以甲骨文单偏旁最大极值稳定区域内的每个点的坐标为样本,计算整个甲骨文单偏旁的极值稳定区域的几何0阶矩和几何1阶矩:m00=∑I(x,y),m01=∑yI(x,y),m10=∑xI(x,y);
S32:确定甲骨文单偏旁区域椭圆拟合的长半轴、短半轴、角度,令a表示长半轴,b表示短半轴,θ表示角度,

λ1、λ2为中心二阶矩的两个特征值,其中:μ20=∑(x-xc)2I...

【专利技术属性】
技术研发人员:林小渝陈善雄李然康高未泽邱小刚
申请(专利权)人:西南大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1