笔画提取模型的训练方法以及装置制造方法及图纸

技术编号:41212159 阅读:20 留言:0更新日期:2024-05-09 23:35
本说明书实施例提供笔画提取模型的训练方法以及装置,其中所述方法包括:按照预设字体构造策略对初始字体数据进行调整,获得初始字体数据对应的模拟字体数据,以及模拟字体数据对应的模拟笔画数据;基于模拟字体数据和模拟字体数据对应的字体二值数据生成训练字体数据;通过训练字体数据和模拟笔画数据对初始模型进行训练,获得初始笔画提取模型;确定基础字体数据和基础字体数据对应的基础笔画数据;通过基础字体数据和基础笔画数据对初始笔画提取模型进行微调,获得目标笔画提取模型。根据构造的模拟字体数据和模拟笔画数据结合字体二值数据生成训练字体数据进行模型预训练,利用基础字体数据对模型进行微调,获得预测能力更好的笔画提取模型。

【技术实现步骤摘要】

本说明书实施例涉及图像分割,特别涉及笔画提取模型的训练方法、笔画提取方法、笔画提取系统。


技术介绍

1、汉字笔画是组成汉字的最小基本单位,汉字字形切分又被称为汉字笔画提取。笔画提取已经称为中文字库自动生成、笔迹鉴别、书法美观评价等任务的关键技术。而汉字的笔画自动分割和提取是一个重要且具挑战性的任务。汉字笔画分割提取的挑战性主要体现在汉字结构复杂,不同字体的笔画连接,笔画的形态和长短粗细各有不同,即使相同字体之间、笔画与笔画之间、部件与部件之间的相对位置甚至笔画的倾斜角度也会发生变化。目前的传统笔画提取方法规则复杂、对于汉字的提取效果不理想,在正确率和效率上不能达到满意的效果。因此,如何准确快速地提取汉字笔画是目前亟需解决的问题。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种笔画提取模型的训练方法、一种笔画提取方法。本说明书一个或者多个实施例同时涉及一种笔画提取模型的训练装置、一种笔画提取装置、一种笔画提取系统,一种计算设备,一种计算机可读存储介质以及一种计算机程序产品,以解决现有技术中存在的技术缺陷。本文档来自技高网...

【技术保护点】

1.一种笔画提取模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,按照预设字体构造策略对初始字体数据进行调整,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述调整参数对所述初始字体数据进行调整,包括:

4.根据权利要求1所述的方法,其特征在于,基于所述模拟字体数据和所述模拟字体数据对应的字体二值数据生成训练字体数据,包括:

5.根据权利要求1所述的方法,其特征在于,通过所述训练字体数据和所述模拟笔画数据对初始模型进行训练,获得初始笔画提取模型,包括:

6.根据权利要求1所述的方法,其特征在于...

【技术特征摘要】

1.一种笔画提取模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,按照预设字体构造策略对初始字体数据进行调整,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述调整参数对所述初始字体数据进行调整,包括:

4.根据权利要求1所述的方法,其特征在于,基于所述模拟字体数据和所述模拟字体数据对应的字体二值数据生成训练字体数据,包括:

5.根据权利要求1所述的方法,其特征在于,通过所述训练字体数据和所述模拟笔画数据对初始模型进行训练,获得初始笔画提取模型,包括:

6.根据权利要求1所述的方法,其特征在于,确定基础字体数据和所述基础字体数据对应的基础笔画数据,包括:

7.根据权利要求1所述的方法,其特征在于,通过所述基础字体数据和所述基础笔画数据对所述初始笔画提取模型进行微调,获得目标笔画提取模型,包括:

【专利技术属性】
技术研发人员:张亚洲李云锦文章
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1