【技术实现步骤摘要】
基于融合形态特征的自适应多卷积神经网络文字识别方法
本专利技术涉及一种文字识别方法,尤其涉及一种基于融合形态特征的自适应多卷积神经网络文字识别方法。
技术介绍
传统的文字识别方法往往聚焦于某一种特定的语言文字,研究者们通过对语言文字的特征进行针对性地提取,往往可以得到识别率较高的模型。然而,在现实世界中,往往会存在多种文字同时出现的场景,如汉字、英语、数字往往会同时出现,这种情况下,很难对不同类型的语言文字进行统一的特征提取。此外,随着不同类型的语言文字的增加,所要分类的类别也会增加,从而导致识别模型识别效率过慢的问题,同时,不同类型的语言文字存在相似字的情况,也会影响到模型的识别率。文字识别一直是模式识别领域中的热门研究点。人类社会中的很大一部分信息包含在文字中,若能有一种较通用的方法能将文字快速且准确的识别出来,将极大的有助于计算机对信息的分析与理解。多年来,许多研究者提出了不少的方法,如基于模板匹配的方法、基于机器学习的方法、基于深度学习的方法等,也有一些较成熟的文字识别工具,如Google的开 ...
【技术保护点】
1.一种基于融合形态特征的自适应多卷积神经网络文字识别方法,其特征在于,包括:对待识别图像进行文字轮廓特征提取;对待识别图像中的文字图像通过自适应分类算法进行分类;根据分类结果将文字图像分配到不同密度的文字识别卷积神经网络中,将提取的文字轮廓特征与对应的文字图像特征进行融合,获得识别结果。/n
【技术特征摘要】
1.一种基于融合形态特征的自适应多卷积神经网络文字识别方法,其特征在于,包括:对待识别图像进行文字轮廓特征提取;对待识别图像中的文字图像通过自适应分类算法进行分类;根据分类结果将文字图像分配到不同密度的文字识别卷积神经网络中,将提取的文字轮廓特征与对应的文字图像特征进行融合,获得识别结果。
2.根据权利要求1所述的基于融合形态特征的自适应多卷积神经网络文字识别方法,其特征在于,对待识别图像进行处理前进行图像预处理。
3.根据权利要求1所述的基于融合形态特征的自适应多卷积神经网络文字识别方法,其特征在于,不同密度的文字识别卷积神经网络包括:低密度文字识别卷积神经网络、中密度文字识别卷积神经网络、高密度文字识别卷积神经网络。
4.根据权利要求2所述的基于融合形态特征的自适应多卷积神经网络文字识别方法,其特征在于,图像预处理包括:灰度化处理、归一化处理。
5.根据权利要求1所述的基于融合形态特征的自适应多卷积神经网络文字识别方法,其特征在于,文字轮廓特征提取包括:获取文字整体外形比例;获取文字整体外形比例包括:获取文字的最小外接矩形外框,获取矩形外框的长宽比信息。
6.根据权利要求5所述的基于融合形态特征的自适应多卷积神经网络文字识别方法,其特征在于,根据外框尺寸及文字所占的像素点信息获取密度值,对外框尺寸进行等比例放大至设定值,获取放大后的相对密度值;根据相对密度值落入的范围,将文字图像分配到对应的文字识别卷积神经网络中识别。
7.根据权利要求6所述的基于融合形态特征的自适应多卷积神经网络文字识别方法,其特征在于,将文字图像分配到对应的第一文字识别卷积神经网络中识别后,获得识别结果,获取第一识别率;
如果识别率低于一设定阈值,则将文字图像分配到最接近的密度值范围对应的第二文字识别卷积神经网络中进行识别,获取第二识别率;
如果第二识别率高于第一识别率,则对应该密度值的文字图像分配到第二第二文字识别卷积神经网络中进行识别;如...
【专利技术属性】
技术研发人员:刘晋,余超,李云辉,栾翠菊,
申请(专利权)人:上海海事大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。