【技术实现步骤摘要】
图像中文字的识别装置
本专利技术实施例涉及计算机视觉
,尤其涉及一种图像中文字的识别装置。
技术介绍
基于计算机视觉的光学字符识别(OpticalCharacterRecognition,OCR),已经被广泛应用于商业领域。光学字符识别检测和识别自然场景图像中的文本仍然是具有挑战性的。包含自然场景的图片会存在很多影响文字识别的因素。例如,大量的光照变化、透视扭曲、图片质量、文本字体、不同的背景等。当需要检测的图像中文字存在倾斜,扭曲或者背景不同的情况下,光学文字识别的识别准确率会受一定的影响。
技术实现思路
本专利技术实施例提供一种图像中文字的识别装置,能够实现对图像中文字进行校正处理,提高识别准确率。本专利技术提供了一种图像中文字的识别装置,预先利用训练样本集对文字识别模型进行训练,装置包括:图像输入模块,用于将目标图像输入所述文字识别模型;第一特征提取模块,用于对所述目标图像提取第一深度的第一图像特征;第一特征处理模块,用于对所述第一图像特征进行第一空间变 ...
【技术保护点】
1.一种图像中文字的识别装置,其特征在于,对文字识别模型预先利用训练样本集进行训练,所述装置包括:/n图像输入模块,用于将目标图像输入所述文字识别模型;/n第一特征提取模块,用于对所述目标图像提取第一深度的第一图像特征;/n第一特征处理模块,用于对所述第一图像特征进行第一空间变换,得到第一空间变换矩阵;/n第二特征提取模块,用于对所述第一空间变换矩阵提取第二深度的第二图像特征,所述第二深度的图像特征提取使用的第一卷积层的层数大于所述第一深度;/n第二特征处理模块,用于对所述第二图像特征进行第二空间变换,得到第二空间变换矩阵;/n文字识别模块,用于根据所述第二空间变换矩阵,得 ...
【技术特征摘要】
1.一种图像中文字的识别装置,其特征在于,对文字识别模型预先利用训练样本集进行训练,所述装置包括:
图像输入模块,用于将目标图像输入所述文字识别模型;
第一特征提取模块,用于对所述目标图像提取第一深度的第一图像特征;
第一特征处理模块,用于对所述第一图像特征进行第一空间变换,得到第一空间变换矩阵;
第二特征提取模块,用于对所述第一空间变换矩阵提取第二深度的第二图像特征,所述第二深度的图像特征提取使用的第一卷积层的层数大于所述第一深度;
第二特征处理模块,用于对所述第二图像特征进行第二空间变换,得到第二空间变换矩阵;
文字识别模块,用于根据所述第二空间变换矩阵,得到对所述目标图像中包括的文字的识别结果。
2.如权利要求1所述的装置,其特征在于,所述第一特征提取模块包括:
像素矩阵获取单元,用于获取所述目标图像的像素矩阵;
卷积计算单元,用于对所述像素矩阵进行预设窗口大小的卷积运算,得到所述第一图像特征。
3.如权利要求1所述的装置,其特征在于,所述第一特征处理模块和所述第二特征处理模块包括:
参数确定单元,用于根据所述第一图像特征以及预设的第一空间变换的形式,确定至少一个变换参数;
映射关系确定单元,用于根据所述变换参数,搜索确定输入特征与输出特征之间的映射关系;
矩阵变换单元,用于根据所述第一图像特征以及所述映射关系,得到第一空间变换矩阵。
4.如权利要求1所述的装置,其特征在于,所述第二特征提取模块包括:
特征矩阵...
【专利技术属性】
技术研发人员:茅心悦,
申请(专利权)人:上海智臻智能网络科技股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。