【技术实现步骤摘要】
一种手写字符图像相似度确定模型训练方法
[0001]本专利技术涉及图像处理
,尤其涉及一种手写字符图像相似度确定模型训练方法。
技术介绍
[0002]高维数据例如图像、音频等在日常生活中愈发普遍,因而可对其提取有用信息的特征学习方法显得尤为重要。手写体识别即是对其中某种高维信息进行特征提取并利用的一个实例。它通过电子专用设备将纸质手写文本电子化,得到计算机存储的字符图像,之后通过一系列特征学习的方法提取图像特征、分类等操作得到最终识别的字符。一旦得出高效准确识别字符的方法,可应用到办公自动化、机器翻译等领域,即可带来巨大的社会和经济效益。但是有效地抽取手写体图像特征的过程具有一定难度,到目前为止,手写体字符识别距实用要求还有一定距离。目前的大部分研究工作都集中在处理手写体图像特征提取问题,且也已取得一定的成果。但是从真实世界中采集的图像通常存在包含噪声、数据缺失等问题,因此需要提出一种更鲁棒的算法来进行特征提取。
[0003]中国专利公开号:CN102982330A公开了一种文字图像中字符识别方法和识别装置,包括:对所述文字图像中切割出的字符,以设定单位进行划分;并对每个设定单位内的字符进行识别;其中,对于一个设定单位,确定该设定单位内的字符的识别结果的方法流程,具体包括如下步骤:对所述设定单位内的每个字符进行特征提取和特征匹配后,确定每个字符的候选字;针对所述设定单位内的每个字符,确定该字符的每个候选字的相似度、以及该字符的每个候选字与该字符相邻的字符的候选字之间的转移概率;根据确定出的相似度和转移概 ...
【技术保护点】
【技术特征摘要】
1.一种手写字符图像相似度确定模型训练方法,其特征在于,包括:步骤S1、数据识别模块识别若干手写字符图像;步骤S2、数据处理模块提取各所述手写字符图像中手写字符以确定所述手写字符的复杂度;步骤S3、所述数据处理模块根据所述手写字符的复杂度所处复杂度水平确定所述手写字符与数据库中的若干字符的匹配方式;步骤S4、等级评价模块在相应匹配方式下确定所述手写字符与数据库中的各字符的相似度等级;步骤S5、所述等级评价模块根据所述相似度等级确定所述手写字符与数据库中的各字符是否匹配;步骤S6、建模模块建立卷积神经网络模型,并将各所述手写字符图像和对应匹配完成的所述数据库中的字符作为单个数据集并将若干数据集以预设比例划分为训练集和验证集;步骤S7、训练模块将所述训练集输入所述卷积神经网络模型以训练所述卷积神经网络模型;步骤S8、验证模块将所述验证集输入训练完成的所述卷积神经网络模型并确定所述卷积神经网络模型的验证准确率;步骤S9、数据调整模块在所述验证准确率低于准确率标准时,确定对所述匹配方式的优化方式;其中,当所述复杂度处于第一复杂度水平,所述数据处理模块根据皮尔逊相关系数确定所述手写字符与相应数据库中的字符是否匹配;或当所述复杂度处于第二复杂度水平,所述数据处理模块计算所述手写字符与所述数据库中的字符的相似度,并确定所述数据库中的字符的所述相似度等级,以在所述相似度等级为第三相似度等级时,计算所述手写字符与所述第三相似度等级的字符的平均曲率差值以确定手写字符与所述数据库中的字符是否匹配。2.根据权利要求1所述的手写字符图像相似度确定模型训练方法,其特征在于,在所述步骤S3中,当所述数据处理模块在所述复杂度处于第一复杂度水平时,所述数据处理模块将所述手写字符与数据库中的若干字符的匹配方式设置为第一匹配方式,所述第一匹配方式包括计算所述手写字符基于空间分布的特征向量,并计算所述特征向量与数据库中的各字符的特征向量的皮尔逊相关系数,以根据皮尔逊相关系数与预设皮尔逊相关系数的比对结果确定所述手写字符与相应数据库中的字符是否匹配。3.根据权利要求1所述的手写字符图像相似度确定模型训练方法,其特征在于,在所述步骤S3中,当所述数据处理模块在所述复杂度处于第二复杂度水平下,所述数据处理模块将所述手写字符与数据库中的若干字符的匹配方式设置为第二匹配方式,所述第二匹配方式包括计算所述手写字符与所述数据库中的字符的相似度W,设定:W=B
×
N
×
ZB=1
‑
|B1
‑
B2|/
△
BmaxZ=1
‑
(H/Z0)其中,B为笔画数相似度,B1为手写字符的笔画数,B2为数据库中的字符的笔画数,
△
Bmax为数据库中最多笔画数字符与最少笔画数字符的笔画数差值,N为结构相似度,Z为形状相似度,H为衡量两个字符轮廓点集之间的Hausdorff距离,Z0为字符图像的对角线长度。4.根据权利要求3所述的手写字符图像相似度确定模型训练方法,其特征在于,当所述数据处理模块计算所述相似度完成时,所述等级评价模块根据相似度与预设相似度的比对结果对数据库中的字符的相似等级进行判定,相似等级包括第一相似度等级、第二相似度等级和第三相似度等级,所述预设相似度包括用以划分所述数据库中的第一相似度等级的字符和第二相似度等级的字符的第一预设相似度以及用以划分第二相似度等级的字符和第三相似度等级的字符的第二预设相似度,其中第一预设相似度小于第二预设相似度。5.根据权利要求4所述的手写字符图像相似度确定模型训练方法,其特征在于,当所述等级...
【专利技术属性】
技术研发人员:徐丹,白世亮,
申请(专利权)人:深圳宏途教育网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。