【技术实现步骤摘要】
基于目标检测和知识图谱的古文字识别方法
[0001]本专利技术属于图像处理和识别
,具体地,涉及一种基于目标检测和知识图谱的古文字识别方法。
技术介绍
[0002]从字母、数字到汉字,OCR(光学字符识别)技术已经广泛应用在办公领域。例如百度文字识别,可以通过拍照和截图的方式,对图片中的中、英、法等多语种进行识别。尽管市面上有诸多公司投身于文字识别领域中,且作出巨大贡献,但在古文字的识别工作上,尚未进行充分的应用。目前,通过相似度计算可以对秦朝(小篆)以前的古文字、书法进行识别。通过神经网络类模型,也可对常用的手写汉字图片进行识别。然而,对于小篆(秦朝)以前的古文字,例如甲骨文、金文、战国文字等,现有的技术方法并不适用。因为目前甲骨文、金文大约有4500个汉字,其中被考释的只有2000余个,而每个单字所出现的次数过少且异体字多,导致训练集中的数据量不够充分,神经网络无法有效的提取文字的特征,因此导致模型几乎无法正确识别古文字。除此之外,由于训练单字数据过少的问题,很难对大多数的古文字进行分类。
[0003]目前 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于目标检测和知识图谱的古文字识别方法,其特征在于,包括如下步骤:步骤一、对古文字图片数据进行部件标注和数据预处理,以扩充古文字图像数据集
①
收集古文字图片,获得古文字样本图像,遍历古文字样本图像,对每张古文字样本图像中的古文字用标注框进行部件标注,并将对应的标注作为部件分类标签;
②
对标注好部件分类标签的古文字样本图像进行数据预处理,以扩充古文字图像数据集;所述预处理的方法包括图片大小调整、色域变换和图片翻转;步骤二、构建古文字部件识别模型,利用步骤一中扩充后的古文字图像数据集训练古文字部件识别模型,对古文字部件进行检测,识别出古文字图片所包含的部件和部件的位置坐标;所述古文字部件识别模型中主干特征提取网络通过对YOLOv4算法中的CSPDarknet53网络用MobileNet网络进行替换生成,并且YOLOv4算法中加强特征提取网络由空间金字塔池化网络SPP和路径聚合网络PANet构成,采用yolohead预测网络进行预测来识别出古文字的部件;步骤三、根据步骤二识别出的古文字图片所包含的部件和部件的位置坐标,构建古文字部件位置关系识别模型,得出部件的位置关系,以判断文字结构;所述古文字部件位置关系识别模型中文字结构包括独体字、上下结构、左右结构、包围结构、左中右结构、上中下结构、左右上下结构和上下左右结构;步骤四、构建古文字知识图谱;步骤五、通过所述古文字知识图谱,根据部件和部件位置关系来推理出文字结果。2.根据权利要求1所述的基于目标检测和知识图谱的古文字识别方法,其特征在于,步骤一中还包括:对标注好部件分类标签的古文字样本图像进行裁剪,得到单字样本集合,所述单字样本为具有标签的部件图像,且每个单字样本对应一个部件;对单字样本进行预处理,所述预处理的方法包括图片大小调整、色域变换和图片翻转;预处理后,通过图像拼接方法对单字样本进行拼接扩充原数据集。3.根据权利要求1所述的基于目标检测和知识图谱的古文字识别方法,其特征在于:当部件坐标满足以下关系时,文字结构是左右结构;当部件坐标满足以下关系时,文字结构是上下结构;
当部件坐标满足以下关系时,文字结构是包围结构;当部件坐标满足以下关系时,文字结构是左右上下结构;当部件坐标满足以下关系时,文字结构是上下左右结构;
当部件坐标满足以下关系时,文字结构是上中下结构;当部件坐标满足以下关系时,文字结构是左中右结构;
技术研发人员:徐昊,李沿增,吴垒,史大千,刁晓蕾,
申请(专利权)人:吉林大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。