一种基于深度学习的自然场景图片文字识别方法技术

技术编号:22001210 阅读:30 留言:0更新日期:2019-08-31 05:39
本发明专利技术提供一种基于深度学习的自然场景图片文字识别方法。所述基于深度学习的自然场景图片文字识别方法包括以下步骤:S1:建立文字图像数据库,并对其进行分类;S2:通过图像采集器进行图像采集,并对采集的图像进行预处理;S3:利用深度神经网络对预处理后的图像进行特征提取,并对提取的特征通过统计分类器进行分类;S4:利用人工设计特征,使用模板匹配的方法进行辅助训练。本发明专利技术提供的基于深度学习的自然场景图片文字识别方法,通过对比度处理、防噪处理和放大分隔处理,能够图像的对比度提升效果较好,使得图像具有较高的质量,同时能够有效的提高图像的识别率,降低外界环境因素对其造成的影响,并且有效的提高其特征提取率。

A Natural Scene Picture Character Recognition Method Based on Deep Learning

【技术实现步骤摘要】
一种基于深度学习的自然场景图片文字识别方法
本专利技术涉及文字识别领域,尤其涉及一种基于深度学习的自然场景图片文字识别方法。
技术介绍
文字识别技术,是模式识别应用的一个重要领域,50年代开始探讨一般文字识别方法,并研制出光学字符识别器,60年代出现了采用磁性墨水和特殊字体的实用机器,60年代后期,出现了多种字体和手写体文字识别机,但识别精度和机器性能都很不理想,70年代,主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究,现如今文字识别技术已经提升了很多。目前的基于深度学习的自然场景图片文字识别方法,在使用时,无法保证其识别和特征提取的准确率,不利于广泛推广使用。因此,有必要提供一种基于深度学习的自然场景图片文字识别方法解决上述技术问题。
技术实现思路
本专利技术提供一种基于深度学习的自然场景图片文字识别方法,解决了目前的基于深度学习的自然场景图片文字识别方法,在使用时,无法保证其识别和特征提取的准确率的问题。为解决上述技术问题,本专利技术提供的基于深度学习的自然场景图片文字识别方法包括以下步骤:S1:建立文字图像数据库,并对其进行分类;S2:通过图像采集器进行本文档来自技高网...

【技术保护点】
1.一种基于深度学习的自然场景图片文字识别方法,其特征在于,包括以下步骤:S1:建立文字图像数据库,并对其进行分类;S2:通过图像采集器进行图像采集,并对采集的图像进行预处理;S3:利用深度神经网络对预处理后的图像进行特征提取,并对提取的特征通过统计分类器进行分类;S4:利用人工设计特征,使用模板匹配的方法进行辅助训练,并进行匹配。

【技术特征摘要】
1.一种基于深度学习的自然场景图片文字识别方法,其特征在于,包括以下步骤:S1:建立文字图像数据库,并对其进行分类;S2:通过图像采集器进行图像采集,并对采集的图像进行预处理;S3:利用深度神经网络对预处理后的图像进行特征提取,并对提取的特征通过统计分类器进行分类;S4:利用人工设计特征,使用模板匹配的方法进行辅助训练,并进行匹配。2.根据权利要求1所述的基于深度学习的自然场景图片文字识别方法,其特征在于,所述文字图像数据库以楷书单字、甲骨文单字等为索引条目,对指定来源中的单字的形体进行扫描或拍照,获取标准形体,并进行分类标签。3.根据权利要求1所述的基于深度学习的自然场景图片文字识别方法,其特征在于,所述S2中图像的预处理包括对比度处理、去噪处理、分隔剥离处理和扩充数据库。4.根据权利要求3所述的基于深度学习的自然场景图片文字识别方法,其特征在于,所述对比度处理:对采集的图像进行处理,获取采集的图像的全图关注程度权重映射图,全图关注程度权重映射图包括分别与采集的图像的多个像素对应的多个映射点,每一映射点均具有对应的权重值,而后将采集的图像划分为多个原始区块,利用全图关注程度权重映射图及预设的灰阶转换公式分别对多个原始区块进行直方图均衡化处理形成多个转换区块,具体为利用全图关注程度权重映射图及预设的灰阶转换公式分别计算每一原始区块中的各个像素的原始灰阶对应的转换灰阶并利用转换灰阶对原始灰阶进行替换,从而形成多个转换区块,最终对多个转换区块进行拼接处理形成处理后的图像。5.根据权利要求3所述的基于深度学习的自然场景图片文字识别方法,其特征在于,所述防躁处理:选取一定数量的目标测试样本;进行人工标注,并将标注好的样本集划分为开发样...

【专利技术属性】
技术研发人员:赵春阳章奇陈晓飞欧杨磊
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1