拓片甲骨文字符图像增广方法、系统、计算机设备及介质技术方案

技术编号:26305582 阅读:44 留言:0更新日期:2020-11-10 20:03
本发明专利技术公开了一种拓片甲骨文字符图像增广方法、系统、计算机设备及介质,所述方法包括:将临摹甲骨文字符图像集合输入字形增广模块进行随机形态处理,得到增广临摹甲骨文字符图像集合;构建风格迁移网络,以学习增广临摹甲骨文字符图像集合的分布到拓片甲骨文字符图像集合的分布之间的映射函数;将增广临摹甲骨文字符图像集合输入风格迁移网络进行处理,得到拓片甲骨文图像增广数据集;将拓片甲骨文字符图像集合与拓片甲骨文图像增广数据集混合,对拓片甲骨文字符识别网络进行训练。本发明专利技术可得到总数充足且类别平衡的增广数据集,以解决拓片甲骨文字符识别任务中的缺少训练数据的问题,利用增广数据集进行训练能够提升识别模型的精度。

【技术实现步骤摘要】
拓片甲骨文字符图像增广方法、系统、计算机设备及介质
本专利技术涉及一种拓片甲骨文字符图像增广方法、系统、计算机设备及存储介质,属于图像处理与人工智能领域。
技术介绍
甲骨文是我国现存最早的文字系统,也是世界上现存最早的象形文字之一,在商代被广泛用于各种事件的占卜,包括战争、农耕和医疗等活动,是当代人研究古代历史与文化的宝贵资料。自甲骨文被发掘以来,史学家对于甲骨文的研究已经取得一定的成果,包括甲骨残片缀合和甲骨文字考释等。但这些工作都严重依赖史学家的专业知识,并且在海量的史料面前,专家需要花费大量时间进行人工检索与理解,这会耗费大量的精力与时间,降低研究效率。随机计算机技术的发展,如何利用自动化技术加速甲骨文研究,以便更好地传承文化与发展这块文化瑰宝,具有十分重大的现实意义。甲骨文研究自动化的第一阶段是通过拍照/扫描的手段将甲骨文史料转化成数字图像,第二阶段是将图像中的甲骨文识别成计算机可以存储并检索的文字编码数据库,第三阶段是利用数据库服务下游任务,包括甲骨残片自动缀合,甲骨史料检索等。目前关于甲骨文研究自动化的工作还处在第二阶段,虽本文档来自技高网...

【技术保护点】
1.一种拓片甲骨文字符图像增广方法,其特征在于,所述方法包括:/n将临摹甲骨文字符图像集合输入字形增广模块进行随机形态处理,得到增广临摹甲骨文字符图像集合;/n构建风格迁移网络,以学习增广临摹甲骨文字符图像集合的分布到拓片甲骨文字符图像集合的分布之间的映射函数;/n将增广临摹甲骨文字符图像集合输入风格迁移网络进行处理,得到拓片甲骨文图像增广数据集;/n将拓片甲骨文字符图像集合与拓片甲骨文图像增广数据集混合,对拓片甲骨文字符识别网络进行训练。/n

【技术特征摘要】
1.一种拓片甲骨文字符图像增广方法,其特征在于,所述方法包括:
将临摹甲骨文字符图像集合输入字形增广模块进行随机形态处理,得到增广临摹甲骨文字符图像集合;
构建风格迁移网络,以学习增广临摹甲骨文字符图像集合的分布到拓片甲骨文字符图像集合的分布之间的映射函数;
将增广临摹甲骨文字符图像集合输入风格迁移网络进行处理,得到拓片甲骨文图像增广数据集;
将拓片甲骨文字符图像集合与拓片甲骨文图像增广数据集混合,对拓片甲骨文字符识别网络进行训练。


2.根据权利要求1所述的拓片甲骨文字符图像增广方法,其特征在于,所述将临摹甲骨文字符图像集合输入字形增广模块进行随机形态处理,得到增广临摹甲骨文字符图像集合,具体包括:
将甲骨文字符形态上的端点、拐点、交点和分叉点定义为字符关键点,利用目标检测算法检测临摹甲骨文字符图像集合中的关键点,对于一张特定的临摹甲骨文字符图像,关键点表示如下:



其中,表示第i个关键点在图像中的位置坐标,N表示该图像中的字符关键点总数;
在临摹甲骨文字符图像的关键点P上施加随机抖动,得到字形增广临摹图像的关键点,如下:



其中,和采样自均匀分布;
运用三角剖分算法将关键点P和P′分解为若干个三角形区域,对每个三角形区域进行仿射变换和图像插值,进而将临摹甲骨文字符图像变换为姿态增广临摹图像;
对姿态增广临摹图像进行随机的形态学腐蚀/膨胀,给字符添加笔画细化/加粗效果,得到字形增广临摹图像,从而得到增广临摹甲骨文字符图像集合。


3.根据权利要求2所述的拓片甲骨文字符图像增广方法,其特征在于,所述仿射变换的操作如下:



其中,(x,y)和(x′,y′)分别为变换前后的像素坐标,变换参数ai,j由P和P′中的三角形顶点坐标联立方程解得。


4.根据权利要求2所述的拓片甲骨文字符图像增广方法,其特征在于,所述腐蚀/膨胀的操作如下:



【专利技术属性】
技术研发人员:黄双萍杨代辉李豪杰金连文
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1