基于部首检测与拆分的字体自适应汉字识别方法技术

技术编号：44652020 阅读：15 留言：0更新日期：2025-03-17 18:42

本发明专利技术属于图像识别技术领域，具体涉及一种字体自适应汉字识别方法，为了解决汉字部首频次分布不平衡导致低频次部首识别不准确的技术问题，同时兼顾模型对于多种字体数据的泛化能力和维持可接受的数据标注成本，本发明专利技术提供一种“基于部首检测与拆分的字体自适应汉字识别方法”，增加弱监督学习模块，通过有部首位置标签信息数据和无部首位置标签信息数据间的对比学习，实现针对未标注数据的弱监督学习，避免对多种字体进行部首位置标注，降低人工数据标注成本，提高模型对多种字体的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像识别，具体涉及一种字体自适应汉字识别方法。

技术介绍

1、现有的基于神经网络模型的汉字字符识别的方法大致可以分为三类：基于分类的方法、基于部首的方法和基于笔画的方法。基于分类的方法将汉字识别作为一种多分类的任务，每个汉字对应一个类别，这种方式更适用于针对英文字符的识别，而汉字的数量过多，常见的汉字就有七千多个，导致分类模型的最后一层全连接层参数过于庞大，而且针对未在训练数据中出现的汉字识别，模型迁移成本较高。

2、针对这一不足，基于部首的方法和基于笔画的方法将汉字解构为部首，或进一步拆解为笔画，通过此类方式，大大降低了涉及分类的类别数目。但由于引入了拆分的结构特征，需要对部首或笔画进行相应的数据标注，而为了提高模型对于不同字体的泛化能力，还需使用不同书写风格的汉字字符图像构建数据集，导致数据标注成本进一步提高。此外，由于构成汉字的部首在常见汉字中出现的频次分布极不平衡，部首数据呈现长尾分布状，这一性质导致高频次的数据较多，而低频次的数据较少，严重影响模型对于低频次部首的识别准确性。

【技术保护点】

1.基于部首检测与拆分的字体自适应汉字识别方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于部首检测与拆分的字体自适应汉字识别方法，其特征在于，多个所述批处理数据中，一个批处理数据包括三类数据，有汉字标签信息和部首标签信息的图像数据d1，无部首标签信息、与d1汉字标签信息相同的图像数据d2，无部首标签信息、与d1汉字标签信息不同的图像数据d3。

3.根据权利要求1所述的基于部首检测与拆分的字体自适应汉字识别方法，其特征在于，所述模型骨干模块由卷积层、最大池化层、非线性层构成，输入批处理数据中的汉字字符图像进行特征提取和下采样后输出特征图其中H、W表示汉...

【技术特征摘要】

1.基于部首检测与拆分的字体自适应汉字识别方法，其特征在于，包括如下步骤：

3.根据权利要求1所述的基于部首检测与拆分的字体自适应汉字识别方法，其特征在于，所述模型骨干模块由卷积层、最大池化层、非线性层构成，输入批处理数据中的汉字字符图像进行特征提取和下采样后输出特征图其中h、w表示汉字字符图像的高度和宽度，c、h′、w′分别表示特征图的通道数、高度和宽度；

4.根据权利要求3所述的基于部首检测与拆分的字体自适应汉字识别方法，其特征...

【专利技术属性】
技术研发人员：王振鑫，刘鸿儒，贺亮，张俊鹏，柴源，杨浩，刘周，康诗奇，
申请(专利权)人：吉林省吉林祥云信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人