【技术实现步骤摘要】
基于卷积神经网络深度学习模型的光学字符识别方法
本专利技术涉及计算机视觉、模式识别,自然场景特征识别等
,特别是一种基于卷积神经网络深度学习模型的光学字符识别方法。
技术介绍
光学字符识别因其在现实生活中的实用性得到了国内外学者的广泛关注,目前基于光学字符识别的应用主要集中在扫描文档字符识别。光学字符识别在街景标识符识别,银行身份证信息识别,课堂板书识别等方面也用着广泛的应用前景。光学字符识别具有高效性和便捷性的优点。目前有大量的研究力量正不断推进着光学字符识别领域的发展。通常一个字符识别系统由字符采集,字符分割,特征提取,特征匹配等几个步骤构成。其中特征提取对于字符识别的正确率具有最重要的影响。当使用最具有判别性的特征对字符进行比对匹配时,通常可以获得更好的识别率,反之则会大幅度降低字符识别系统的准确度。而对字符识别的研究也主要集中在字符特征提取的方法上,基于卷积神经网络的深度学习方法在自动检测特征并提取特征方面有着巨大的优势。近些年来,基于卷积神经网络的深度学习模型因其在众多计算机视觉问题中的突出表现而获得了极大的关注。其基本思想是将一个原始图像经过多层 ...
【技术保护点】
1.一种基于卷积神经网络深度学习模型的光学字符识别方法,其特征在于,该方法的具体步骤包括:步骤S1,收集常用的不同字体的汉字,10个阿拉伯数字和26个英文字母并生成图片格式的数据集。步骤S2,对获取的训练集和测试集样本适当进行轻微的旋转和扭曲处理。步骤S3,优化学习训练集的分类器的各层权值矩阵参数W和偏置b,通过随机梯度下降法(SGD)的优化方式最小化目标函数,学习最优分类器参数W和b。
【技术特征摘要】
1.一种基于卷积神经网络深度学习模型的光学字符识别方法,其特征在于,该方法的具体步骤包括:步骤S1,收集常用的不同字体的汉字,10个阿拉伯数字和26个英文字母并生成图片格式的数据集。步骤S2,对获取的训练集和测试集样本适当进行轻微的旋转和扭曲处理。步骤S3,优化学习训练集的分类器的各层权值矩阵参数W和偏置b,通过随机梯度下降法(SGD)的优化方式最小化目标函数,学习最优分类器参数W和b。2.根据权利要求1所述的基于卷积神经网络深度学习模型的光学字符识别方法,其特征在于,在所述步骤S1中,收集所有身份证涉及到的常用汉字和10个阿拉伯数字以及26个英文字母。3.根据权利要求1所述的基于卷积神经网络深度学习模型的光学字符识别方法,其特征在于,在步骤S2中,对训练集和测试集样本进行不相同程度的轻微扭曲和旋转,将处理后的图像作为输入特征。4.根据权利要求1所述的基于卷积神经网络深度学习模型的光学字符识别方法,其特征在于,在步骤S3中,深度学习模型的优化需要通过随机梯度下降法迭代优化策略...
【专利技术属性】
技术研发人员:陆成学,
申请(专利权)人:中科博宏北京科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。