【技术实现步骤摘要】
一种基于优化深度网络的古文字样本采集、检测和识别方法
[0001]本专利技术涉及计算机视觉
,尤其涉及一种基于优化深度网络的古文字样本采集
、
检测和识别方法
。
技术介绍
[0002]古文字研究一直是人类文化遗产保护和历史研究的重要领域
。
然而,传统的古文字研究方法通常需要大量的人力和时间,且存在主观性和误差的问题
。
随着计算机视觉和深度学习技术的快速发展,利用计算机自动化地进行古文字的采集
、
检测和识别成为了可能
。
[0003]目前,可供研究和分析的古文字电子数据集不足,对古文字的识别大多数还停留在根据实物或纸质文献进行人力识别阶段
。
这导致深层网络技术在古文字识别任务中,面临数据不足的问题
。
缺乏大规模
、
高质量的古文字数据集限制了对该文字的全面理解和应用
。
[0004]此外,古文字作为自然数据,具有长尾分布特性,即大部分的古文字出现的频率很低,而极少数出现频率较高,这导致了数据不平衡的问题
。
虽然深层网络模型具有良好的特征提取和分类能力,可以更加高效
、
准确地识别文字,但数据不均衡易导致低频数据的过拟合和高频数据的欠拟合,从而影响识别精度
。
技术实现思路
[0005]专利技术目的:针对上述现有技术,提出一种基于优化深度网络的古文字样本采集
、
检测和识别方法;< ...
【技术保护点】
【技术特征摘要】
1.
一种基于优化深度网络的古文字样本采集
、
检测和识别方法,其特征在于,包括以下步骤:
1)
数据集的获取和扩充;
2)
古文字检测;
3)
古文字识别
。2.
如权利要求1所述的一种基于优化深度网络的古文字样本采集
、
检测和识别方法,其特征在于,步骤
1)
的实现过程为:采集古文字原始拓片图片
、
古文字摹本图片,并存入文件夹中,然后采用
LabelMe
工具对古文字原始拓片图片
、
古文字摹本图片中的古文字进行标注,其中将古文字原始拓片图片和摹本图片的标号进行统一,将标注之后的古文字作为初始数据集,将未进行标注即未知的古文字放进“unknown”文件夹下;对初始数据集进行深层网络训练,并对“unknown”文件夹中未知的古文字进行预测,将预测正确的未知的古文字添加入初始数据集中,迭代训练扩充初始数据集;统计每张集古文字摹本图片上已知古文字的频率并按照频率的大小升序排列,选取后
20
%的摹本图片作为训练集和验证集,其余作为测试集,采用风格迁移
CycleGAN
算法,对古文字原始拓片图片
、
摹本图片两种风格进行图像转换,扩充步骤
1)
中采集的古文字原始拓片图片
、
古文字摹本图片
。3.
如权利要求2所述的一种基于优化深度网络的古文字样本采集
、
检测和识别方法,其特征在于,步骤
2)
中,通过扩充后的摹本图片对
YOLOv7
‑
tiny
模型进行训练,得到训练好的
YOLOv7
‑
tiny
模型,通过训练好的
YOLOv7<...
【专利技术属性】
技术研发人员:袁筱钰,张植博,黄晓华,孙亚博,邵秀燕,柳圣,
申请(专利权)人:南京工程学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。