基于深度学习的甲骨文偏旁的检测与识别方法技术

技术编号：25272053 阅读：22 留言：0更新日期：2020-08-14 23:04

本发明专利技术公开了一种基于深度学习的甲骨文偏旁的检测与识别方法，主要涉及甲骨文识别技术领域。按照以下步骤进行：S1：对甲骨文拓片进行扫描或拍照，获得甲骨文图像；S2：采用最大极值稳定区域算法来筛选甲骨文图像中的甲骨文单偏旁区域；S3：对选定的甲骨文单偏旁区域进行椭圆拟合；S4：采用非极大值抑制算法去除对同一个甲骨文单偏旁多余重复或错误的检测结果，完成甲骨文单偏旁的检测，获得甲骨文单偏旁数据；S5：利用BN‑Lenet网络模型识别甲骨文单偏旁数据。本发明专利技术的有益效果在于：能够获得较高的识别精度，同时将甲骨文视为偏旁组合而非整字识别，能够识别未考释的甲骨文新字，即零样本学习，对甲骨文研究有着重要的应用意义。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的甲骨文偏旁的检测与识别方法
本专利技术涉及甲骨文识别
，具体是基于深度学习的甲骨文偏旁的检测与识别方法。
技术介绍
甲骨文是迄今为止中国发现的年代最早的成熟文字系统，是汉字的源头和中华优秀传统文化的根脉，但甲骨文考释仍然困难重重，尽管考古学家和古文字学家不断努力，但从计算机视觉角度对甲骨文文字分析的研究却很少，也没有相关的公共数据集，虽然有着一些传统的方法尝试对甲骨文字进行识别，如顾绍通提出的基于拓扑配准的识别方法；周新伦等提出利用图论和笔划特点来识别甲骨文字形的方法；李锋等提出利用图特征的原理来识别甲骨文字形的方法；栗青生等提出利用图同构的方法来识别甲骨文字形，但他们往往只将甲骨文字符作为一个整体来处理，没有考虑不同字符之间的相似性和内部结构，也没有考虑甲骨文中不同构但仍为同一字形的异体字问题，但甲骨文中异体字情况大量存在，因而实用性受到限制。
技术实现思路
本专利技术的目的在于解决现有技术中存在的问题，从甲骨文单偏旁的角度出发，分析组成甲骨文常用的基本结构成分，即偏旁，提供一种基于深度学习的甲骨文偏旁的检测与识别方法，能够获得较高的识别精度，同时将甲骨文视为偏旁组合而非整字识别，能够识别未考释的甲骨文新字，即零样本学习，对甲骨文研究有着重要的应用意义。本专利技术为实现上述目的，通过以下技术方案实现：基于深度学习的甲骨文偏旁的检测与识别方法，按照以下步骤进行：S1：对甲骨文拓片进行扫描或拍照，获得甲骨文图像；S2：采用最大极值稳定区域算法来筛选...

【技术保护点】
1.基于深度学习的甲骨文偏旁的检测与识别方法，其特征在于，按照以下步骤进行：/nS1：对甲骨文拓片进行扫描或拍照，获得甲骨文图像；/nS2：采用最大极值稳定区域算法来筛选甲骨文图像中的甲骨文单偏旁区域；/nS3：对选定的甲骨文单偏旁区域进行椭圆拟合；/nS4：采用非极大值抑制算法去除对同一个甲骨文单偏旁多余重复或错误的检测结果，完成甲骨文单偏旁的检测，获得甲骨文单偏旁数据；/nS5：利用BN-Lenet网络模型识别甲骨文单偏旁数据，所述BN-Lenet网络模型包括2个卷积层、2个最大池化层、1个全连接层、1个softmax层、3个批归一化层和1个随机失活层，所述批归一化层位于卷积层与最大池化层之间。/n

【技术特征摘要】
1.基于深度学习的甲骨文偏旁的检测与识别方法，其特征在于，按照以下步骤进行：
S1：对甲骨文拓片进行扫描或拍照，获得甲骨文图像；
S2：采用最大极值稳定区域算法来筛选甲骨文图像中的甲骨文单偏旁区域；
S3：对选定的甲骨文单偏旁区域进行椭圆拟合；
S4：采用非极大值抑制算法去除对同一个甲骨文单偏旁多余重复或错误的检测结果，完成甲骨文单偏旁的检测，获得甲骨文单偏旁数据；
S5：利用BN-Lenet网络模型识别甲骨文单偏旁数据，所述BN-Lenet网络模型包括2个卷积层、2个最大池化层、1个全连接层、1个softmax层、3个批归一化层和1个随机失活层，所述批归一化层位于卷积层与最大池化层之间。

2.根据权利要求1所述的基于深度学习的甲骨文偏旁的检测与识别方法，其特征在于，所述步骤S2具体包括：
S21：将甲骨文图像转换成灰度图像；
S22：在灰度区间[0,255]内的256个不同阈值对灰度图像进行二值化，令Qi表示二值化阈值i对应的二值图像中的某一连通区域，Δ为变化值，当二值化阈值由i变成i+Δ时，连通区域Qi变成Qi+Δ；当二值化阈值由i变成i-Δ时，连通区域Qi变成Qi-Δ；
S23：令v(i)表示两个不同阈值间的区域变化值，其中，Qi表示第i个甲骨文单偏旁连通区域的面积，Δ表示微小的阈值变化，当v(i)小于给定阈值时，认为该甲骨文单偏旁区域为最大极值稳定区域。

3.根据权利要求1所述的基于深度学习的甲骨文偏旁的检测与识别方法，其特征在于，所述步骤S3具体包括：
S31：确定甲骨文单偏旁区域椭圆拟合的重心坐标(xc，yc)，
其中，m00、m01、m10是以甲骨文单偏旁最大极值稳定区域内的每个点的坐标为样本，计算整个甲骨文单偏旁的极值稳定区域的几何0阶矩和几何1阶矩：m00＝∑I(x,y)，m01＝∑yI(x,y)，m10＝∑xI(x,y)；
S32：确定甲骨文单偏旁区域椭圆拟合的长半轴、短半轴、角度，令a表示长半轴，b表示短半轴，θ表示角度，

λ1、λ2为中心二阶矩的两个特征值，其中：μ20＝∑(x-xc)2I...

【专利技术属性】
技术研发人员：林小渝，陈善雄，李然康，高未泽，邱小刚，
申请(专利权)人：西南大学，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人