一种基于优化深度网络的古文字样本采集制造技术

技术编号:39509308 阅读:13 留言:0更新日期:2023-11-25 18:44
本发明专利技术提供了一种基于优化深度网络的古文字样本采集

【技术实现步骤摘要】
一种基于优化深度网络的古文字样本采集、检测和识别方法


[0001]本专利技术涉及计算机视觉
,尤其涉及一种基于优化深度网络的古文字样本采集

检测和识别方法


技术介绍

[0002]古文字研究一直是人类文化遗产保护和历史研究的重要领域

然而,传统的古文字研究方法通常需要大量的人力和时间,且存在主观性和误差的问题

随着计算机视觉和深度学习技术的快速发展,利用计算机自动化地进行古文字的采集

检测和识别成为了可能

[0003]目前,可供研究和分析的古文字电子数据集不足,对古文字的识别大多数还停留在根据实物或纸质文献进行人力识别阶段

这导致深层网络技术在古文字识别任务中,面临数据不足的问题

缺乏大规模

高质量的古文字数据集限制了对该文字的全面理解和应用

[0004]此外,古文字作为自然数据,具有长尾分布特性,即大部分的古文字出现的频率很低,而极少数出现频率较高,这导致了数据不平衡的问题

虽然深层网络模型具有良好的特征提取和分类能力,可以更加高效

准确地识别文字,但数据不均衡易导致低频数据的过拟合和高频数据的欠拟合,从而影响识别精度


技术实现思路

[0005]专利技术目的:针对上述现有技术,提出一种基于优化深度网络的古文字样本采集

检测和识别方法;<br/>[0006]技术方案:一种基于优化深度网络的古文字样本采集

检测和识别方法,其特征在于,包括以下步骤:
[0007]1)
数据集的获取和扩充;
[0008]2)
古文字检测;
[0009]3)
古文字识别

[0010]优选的,步骤
1)
的实现过程为:采集古文字原始拓片图片

古文字摹本图片,并存入文件夹中,然后采用
LabelMe
工具对古文字原始拓片图片

古文字摹本图片中的古文字进行标注,其中古文字原始拓片图片和摹本图片的标号进行统一,将标注之后的古文字作为初始数据集,将未进行标注即未知的古文字放进“unknown”文件夹下;
[0011]对初始数据集进行深层网络训练,并对“unknown”文件夹中未知的古文字进行预测,将预测正确的未知的古文字添加入初始数据集中,迭代训练扩充初始数据集;
[0012]统计每张集古文字摹本图片上已知古文字的频率并按照频率的大小升序排列,选取后
20
%的摹本图片作为训练集和验证集,其余作为测试集,采用风格迁移
CycleGAN
算法,对古文字原始拓片图片

摹本图片两种风格进行图像转换,扩充步骤
1)
中采集的古文字拓片图片

古文字摹本图片

[0013]优选的,步骤
2)
中,通过扩充后的摹本图片对
YOLOv7

tiny
模型进行训练,得到训练好的
YOLOv7

tiny
模型,通过训练好的
YOLOv7

tiny
模型对古文字拓片图片的古文字进行检测

[0014]优选的,步骤
3)
中,根据扩充后的古文字拓片图片

古文字摹本图片,截取古文字单字的图片,对古文字单字的图片进行预处理和切分,其中预处理包括对古文字单字的图片的大小缩放

度旋转

光学色彩调节;根据长尾分布的特征,对于古文字单字的图片的头部类进行随机抽样,再根据分层抽样的方法,将古文字单字的图片切分为训练集

验证集和测试集;
[0015]其次,通过
Mixup
长尾优化的方法对长尾分布的特征进行数据增强,设
λ
为混合系数,其中
0≤
λ
≤1
,则新样本
x
表示为:
[0016]x

λ
x1(1

λ
)x2[0017]新标签
y
表示为:
[0018]y

λ
y1(1

λ
y2[0019]其中随机抽样两个图片样本为
x1,
x2,对应的标签为
y1,
y2;
[0020]接着,将生成的
(x,y)
对投入四种深层网络分类器:
AlexNet

ResNet

Transformer

Cross Transformer
中进行预训练,得到四个训练权重;
[0021]最后,对四种深层网络分类器预训练出的权重,在决策级进行软投票融合的训练,得到最终的识别模型,通过识别模型对古文字进行识别

[0022]有益效果:
[0023]针对古文字的长尾数据分布的特性,本专利技术提出了一种优化的古文字识别融合模型,有效提升了古文字识别的效率

该模型结合了多种技术手段,包括深度学习

迁移学习和数据增强等

通过对长尾数据分布进行建模和处理,本专利技术的模型能够更好地处理低频古文字的识别问题

这种融合模型的创新点在于有效地利用了数据的分布特性,提高了古文字识别的准确性和鲁棒性

[0024]本专利技术通过目标检测和风格迁移等方法,实现了对整片古文字摹本的翻译

传统的古文字翻译方法通常只能处理单个字符或短语的翻译,而本专利技术的方法能够处理整片古文字摹本的翻译任务

通过目标检测技术,本专利技术能够准确地定位和提取古文字区域,然后利用深层网络技术将提取的古文字区域转换为目标风格的文字

这种方法的创新点在于扩展了古文字翻译的范围,提供了更全面和准确的古文字翻译解决方案

[0025]本专利技术通过提出基于长尾优化的古文字识别融合模型和实现整片古文字摹本的翻译,突出了对长尾数据分布的处理和古文字翻译范围的扩展

这些创新点和效益使得本专利技术在古文字研究和应用领域具有重要的实用性和推广价值

与现有的分类方法相比,本专利技术的方法可以有效解决古文字建立数据库和识别的问题,且具有一定的适应性

附图说明
[0026]图1是本专利技术的流程图;
[0027]图2是本专利技术基于迭代的数据采集方法的流程图;
[0028]图3是本专利技术风格迁移对比图;
[0029本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于优化深度网络的古文字样本采集

检测和识别方法,其特征在于,包括以下步骤:
1)
数据集的获取和扩充;
2)
古文字检测;
3)
古文字识别
。2.
如权利要求1所述的一种基于优化深度网络的古文字样本采集

检测和识别方法,其特征在于,步骤
1)
的实现过程为:采集古文字原始拓片图片

古文字摹本图片,并存入文件夹中,然后采用
LabelMe
工具对古文字原始拓片图片

古文字摹本图片中的古文字进行标注,其中将古文字原始拓片图片和摹本图片的标号进行统一,将标注之后的古文字作为初始数据集,将未进行标注即未知的古文字放进“unknown”文件夹下;对初始数据集进行深层网络训练,并对“unknown”文件夹中未知的古文字进行预测,将预测正确的未知的古文字添加入初始数据集中,迭代训练扩充初始数据集;统计每张集古文字摹本图片上已知古文字的频率并按照频率的大小升序排列,选取后
20
%的摹本图片作为训练集和验证集,其余作为测试集,采用风格迁移
CycleGAN
算法,对古文字原始拓片图片

摹本图片两种风格进行图像转换,扩充步骤
1)
中采集的古文字原始拓片图片

古文字摹本图片
。3.
如权利要求2所述的一种基于优化深度网络的古文字样本采集

检测和识别方法,其特征在于,步骤
2)
中,通过扩充后的摹本图片对
YOLOv7

tiny
模型进行训练,得到训练好的
YOLOv7

tiny
模型,通过训练好的
YOLOv7<...

【专利技术属性】
技术研发人员:袁筱钰张植博黄晓华孙亚博邵秀燕柳圣
申请(专利权)人:南京工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1