一种基于数据增强与改进CNN的蒙古文手写体识别方法技术

技术编号:40227856 阅读:19 留言:0更新日期:2024-02-02 22:31
一种基于数据增强与改进CNN的蒙古文手写体识别方法,使用基于密度匹配的快速数据自增强算法扩充蒙古文手写体图像数据集;将扩充后的数据集划分为训练集和测试集;对扩充后数据中的训练集进行预处理,每一批次手写体图像经预处理后得到一个二维矩阵;提取二维矩阵的独立基图像,将相应批次手写体图像投影到独立基图像的空间中得到投影向量,将该投影向量作为提取到的特征向量,并将预处理过的手写体图像与提取到的特征向量相结合,得到特征图像,输入到识别模型一和识别模型二中;使用投票法模型集成策略,集成识别模型一和识别模型二的输出,得到最终识别结果。相较常规方法,本发明专利技术的识别率和鲁棒性均有提升。

【技术实现步骤摘要】

本专利技术属于文字识别,特别涉及一种基于数据增强与改进cnn的蒙古文手写体识别方法。


技术介绍

1、文字识别是图像识别领域的一个重要分支。图像文字识别根据识别内容的不同可以划分为印刷体识别和手写体识别,又根据手写文字数据采集方式不同,可以将手写体识别划分为脱机手写识别和联机手写识别两大类。传统的图像文字识别技术主要是基于统计的机器学习方法,能够较好的完成印刷体文字识别任务,但对于风格迥异的手写体识别往往难以达到理想效果。随着深度学习技术的快速发展,其在特征提取和目标分类方面所展现的优异性能,为手写文字识别技术的研究提供了新思路和新方法,吸引了相关领域人士的广泛关注。

2、蒙古族是一个拥有悠久历史的民族,蒙古族使用的文字有托忒蒙古文、新蒙古文和传统蒙古文。相较于英文和中文而言,蒙古文尤其是传统蒙古文的手写图像识别研究相对滞后,成果较少,在一定程度上制约了学者对大量蒙古文文献的研究进程,拖慢了蒙古文使用地区的信息化步伐。蒙古文与汉语、英语等文字存在较大差异,蒙古文手写体为竖式结构,书写自由度高,字形修长,形态变换多样,这些因素同样为蒙古文手写体研究本文档来自技高网...

【技术保护点】

1.一种基于数据增强与改进CNN的蒙古文手写体识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述基于数据增强与改进CNN的蒙古文手写体识别方法,其特征在于,所述基于密度匹配的快速数据自增强算法,构建一个数据增强策略搜索空间,该空间内有多个图像变换操作,在所述数据增强策略搜索空间内寻找最佳图像变换策略,对于不同的任务学习不同的增强方法;其中一个图像变换策略由若干子策略组成,子策略由每个批次中的每个图像随机选择,每个子策略由两个按顺序执行的图像变换操作组成,每个图像变换操作为一个图像处理函数,每个操作设置有调用操作的概率pi和该操作的幅度λi两个超参数;子策略将输入图像...

【技术特征摘要】

1.一种基于数据增强与改进cnn的蒙古文手写体识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述基于数据增强与改进cnn的蒙古文手写体识别方法,其特征在于,所述基于密度匹配的快速数据自增强算法,构建一个数据增强策略搜索空间,该空间内有多个图像变换操作,在所述数据增强策略搜索空间内寻找最佳图像变换策略,对于不同的任务学习不同的增强方法;其中一个图像变换策略由若干子策略组成,子策略由每个批次中的每个图像随机选择,每个子策略由两个按顺序执行的图像变换操作组成,每个图像变换操作为一个图像处理函数,每个操作设置有调用操作的概率pi和该操作的幅度λi两个超参数;子策略将输入图像数据随机地映射到2n个图像中的一个,其中n为子策略个数。

3.根据权利要求2所述基于数据增强与改进cnn的蒙古文手写体识别方法,其特征在于,在所述数据增强策略搜索空间内寻找最佳图像变换策略,搜索增强策略是一对数据集之间的密度匹配;将原始手写体数据集dtrain分成数据集dm和数据集da,分别用于学习模型参数θ和探索增强策略t;

4.根据权利要求2所述基于数据增强与改进cnn的蒙古文手写体识别方法,其特征在于,所述图像变换操作包括:

5.根据权利要求1或4所述基于数据增强与改进cnn的蒙古文手写体识别方法,其特征在于,所述步骤3,预处理包括:对蒙古文手写体图像进行非线性灰度变换、滤波去噪、几何校正、图像尺寸归一化和图像矩阵向量化;所述几何校正,通过在识别网络前加入一个空间网络层实现;

6.根据权利要求5所...

【专利技术属性】
技术研发人员:仁庆道尔吉冯昆鹏李雷孝吉亚图石宝
申请(专利权)人:内蒙古工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1