一种基于改进Swin Transformer的蒙古文手写体识别方法技术

技术编号:42060998 阅读:64 留言:0更新日期:2024-07-19 16:46
本发明专利技术公开了一种基于改进Swin Transformer的蒙古文手写体识别方法,首先使用扩散模型生成具有人类手写风格的蒙古文手写体图像,并将生成的蒙古文手写体图像预处理,将预处理后的数据集划分为训练集和测试集;进一步构建改进的手写体蒙古文图像识别的特征提取网络,所述特征提取网络由Swin Transformer和ConvNeXt并行连接构成,弥补单一网络在特征提取过程中缺少的全局特征和归纳偏置。利用改进的网络对蒙古文手写体图像进行特征提取,获得特征并编码为两张特征向量图;最后在特征提取网络后增加归一化层、全局平均池化层,通过Softmax激活函数的全连接层输出图像识别的预测结果。本发明专利技术弥补了单一网络识别性能低等问题,提高了手写体蒙古文图像识别准确率。

【技术实现步骤摘要】

本专利技术属于文字识别,特别涉及一种基于改进swin transformer的蒙古文手写体识别方法。


技术介绍

1、文字识别是模式识别的一个重要研究领域。文字识别是将光学图像内容转换成文字的过程,而其中的手写体识别更具有挑战性。由于采集的方式的不同,手写识别分为脱机手写体识别和联机手写体识别。随着不同识别网络的出现,手写体识别的发展变得多维。

2、蒙古文是一种阿尔泰系语言,蒙古文字竖型排列,由上部、中部和下部构成,且具有不对称性结构。并且蒙古文是由字符组成的,每一个字符在蒙古文的不同部分的书写方式不同,导致蒙古文手写体识别具有很大难度。


技术实现思路

1、为了克服上述现有技术的缺点,本专利技术的目的在于提供一种基于改进swintransformer的蒙古文手写体识别方法,用以解决现有蒙古文手写体识别方法识别率不高等问题。

2、为了实现上述目的,本专利技术采用的技术方案是:

3、一种基于改进swin transformer的蒙古文手写体识别方法,包括如下步骤:

4本文档来自技高网...

【技术保护点】

1.一种基于改进Swin Transformer的蒙古文手写体识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述基于Swin Transformer的蒙古文手写体识别方法,其特征在于,所述使用扩散模型生成具有人类手写风格的蒙古文手写体图像,方法如下:

3.根据权利要求1所述基于改进Swin Transformer的蒙古文手写体识别方法,其特征在于,所述利用迭代反向扩散使所述噪声图像转变为目标图像,方法如下:

4.根据权利要求2所述基于改进Swin Transformer的蒙古文手写体识别方法,其特征在于,所述对生成的蒙古文手写体图像进行预处理...

【技术特征摘要】

1.一种基于改进swin transformer的蒙古文手写体识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述基于swin transformer的蒙古文手写体识别方法,其特征在于,所述使用扩散模型生成具有人类手写风格的蒙古文手写体图像,方法如下:

3.根据权利要求1所述基于改进swin transformer的蒙古文手写体识别方法,其特征在于,所述利用迭代反向扩散使所述噪声图像转变为目标图像,方法如下:

4.根据权利要求2所述基于改进swin transformer的蒙古文手写体识别方法,其特征在于,所述对生成的蒙古文手写体图像进行预处理,方法如下:

5.根据权利要求1所述基于改进swin transformer的蒙古文手写体识别方法,其特征在于,所...

【专利技术属性】
技术研发人员:仁庆道尔吉杨洋李雷孝石宝吉亚图乌尼尔
申请(专利权)人:内蒙古工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1