字符识别系统和方法技术方案

技术编号:27434285 阅读:23 留言:0更新日期:2021-02-25 03:15
本公开提供了一种字符识别系统,包括:暗箱,用于遮挡外界光线;文件托盘,设置在暗箱内并用于接收包含待识别的字符的文件;相机,设置在暗箱内并配置成拍摄文件上的字符的图像;和处理器,被配置为从相机接收所拍摄的图像并从所拍摄的图像识别字符。本公开还提供了一种字符识别方法。字符识别方法。字符识别方法。

【技术实现步骤摘要】
字符识别系统和方法


[0001]本公开涉及字符识别的领域,具体地说,涉及字符识别系统和方法。

技术介绍

[0002]随着数字技术和大数据的发展,对纸质文件数字化的需求显著增加。纸质文件的数字化通常需要字符识别技术。然而,在字符识别过程中,对文件进行成像的效果和周围的光照环境对字符识别的结果具有较大的影响。因此,需要一种能够减弱周围环境的影响、提高成像效果并且具有更好的字符识别结果的系统和方法。

技术实现思路

[0003]本技术的目的是提供一种新的和改善的字符识别系统和方法。
[0004]根据本公开的一个或多个实施例,提供了一种字符识别系统,包括:暗箱,用于遮挡外界光线;文件托盘,设置在暗箱内并用于接收包含待识别的字符的文件;相机,设置在暗箱内并配置成拍摄文件上的字符的图像;和处理器,被配置为从相机接收所拍摄的图像并从所拍摄的图像识别字符。
[0005]根据本公开的一个或多个实施例,字符的识别由所述处理器使用经训练的神经网络来执行。
[0006]根据本公开的一个或多个实施例,经训练的神经网络是预先通过多个文件的图像和每个文件中包含的相应字符来训练的。
[0007]根据本公开的一个或多个实施例,不能正确识别其中的字符的文件的图像和相应的字符被提供给经训练的神经网络,以更新神经网络。
[0008]根据本公开的一个或多个实施例,所识别的字符被存储在能够被访问的表格中。
[0009]根据本公开的一个或多个实施例,所述处理器包括以下中的至少一个:多线程处理器和图形处理单元。
[0010]根据本公开的一个或多个实施例,所述相机是具有固定焦距的相机。
[0011]根据本公开的一个或多个实施例,该字符识别系统还包括光源,该光源设置在暗箱内并且被配置为照明文件上的所述字符。
[0012]根据本公开的一个或多个实施例,该字符识别系统还包括显示器,并且在显示器上,所识别的字符被显示在所拍摄的图像中的字符附近。
[0013]根据本公开的一个或多个实施例,所述处理器还被配置为在识别字符之前对所拍摄的图像执行图像处理,其中该图像处理包括以下中的至少一个:提取处理,以提取所拍摄的图像的感兴趣区域;镜像处理,以获得所拍摄的图像的镜像图像;降噪处理,以减少所拍摄的图像中的噪声;灰度化处理,以将所拍摄的图像转换为灰度图像;二值化处理,以将所拍摄的图像转换为二值化图像;形态学处理,以突出所拍摄的图像中的字符的轮廓;图像特征检测处理,以检测所拍摄的图像中的字符的区域;去旋转处理,以调整所拍摄的图像中的字符的方向;归一化处理,以将所拍摄的图像中的字符的尺寸调整为彼此一致;以及分割处
理,以从所拍摄的图像获得每个字符的图像。
[0014]根据本公开的一个或多个实施例,所述分割处理包括在所述字符的区域上滑动一个窗口并且在该窗口中仅包括一个字符时将该字符的图像分割出来,其中,该窗口的尺寸由字符的尺寸来确定,使得能够仅将一个字符包括在窗口中。
[0015]根据本公开的一个或多个实施例,该文件是其上粘贴有一个或多个带有字符的标签的纸。
[0016]根据本公开的一个或多个实施例,该标签是包含中国强制认证(3C)号码的3C标签。
[0017]根据本公开的一个或多个实施例,提供了一种字符识别方法,包括:将包含待识别的字符的文件放置在设置在遮挡外部光线的暗箱内的文件托盘中;通过暗箱内的摄像头拍摄文件上的字符图像;从拍摄的图像中识别文件上的字符。
[0018]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
[0019]通过以下结合附图对示例性实施例的详细描述,本公开的上述和其他方面和优点将变得显而易见,附图通过示例的方式示出了本公开的原理。注意,附图不一定按比例绘制。
[0020]图1示出了根据本公开的示例性实施例的字符识别系统的示意图。
[0021]图2示出了根据本公开的示例性实施例的包含待识别的字符的文件的示意图。
[0022]图3示出了根据本公开的示例性实施例的在显示器上显示的所识别的字符。
[0023]图4A到图4G示出了根据本公开示例性实施例的对拍摄图像执行的图像处理的示意图。
[0024]图5示出了根据本公开的示例性实施例的神经网络的示意图。
[0025]图6示出了根据本公开的示例性实施例的字符识别方法的流程图。
[0026]图7示出了根据本公开的另一个示例性实施例的字符识别系统的示意图。
具体实施方式
[0027]在以下详细描述中,阐述了许多具体细节以提供对所描述的示例性实施例的透彻理解。然而,对于本领域技术人员显而易见的是,可以在没有这些具体细节中的一些或全部的情况下实施所描述的实施例。在其他示例性实施例中,没有详细描述公知的结构或处理步骤,以避免不必要地模糊本公开的概念。
[0028]首先参考图1,示出了根据本公开的示例性实施例的字符识别系统的示意图。字符识别系统100包括暗箱110、设置在暗箱110内的文件托盘111、设置在暗箱110内的照相机112以及处理器120。
[0029]暗箱110被配置为遮挡外部光,以便为字符识别提供稳定的光照环境。具体地,暗箱110由不透明材料制成并且基本封闭,使得外部光可以被遮挡掉。因此,可以减弱周围环境对于成像的影响。
[0030]文件托盘111设置在暗箱110的底部,并且被配置为接收包含待识别的字符的文件
200。在本公开的一些实施例中,暗箱110具有在文件托盘111的一侧的开口114,用于通过该开口114来接收文件200。此外,当文件200位于文件托盘111中时,可以例如通过盖板等来遮挡该开口114,以尽可能避免外部光线进入暗箱110中。在本公开的一些实施例中,文件托盘111的尺寸可以大于文件200的尺寸,以接收具有更大尺寸的文件。此外,文件托盘111的尺寸可以适合于文件200的尺寸,以帮助对准文件200的方向,从而将文件200上的文字定向到固定的方向。
[0031]相机112设置在暗箱110的顶部,并且被配置为拍摄文件200上的字符的图像。在本公开的一些实施例中,相机112是具有固定焦距镜头的相机。此外,相机112可以是可以在暗箱110内没有可见光源的情况下仍然能够拍摄图像的红外相机。在暗箱110内不具有可见光源并且相机112是红外相机的情况下,可以避免可见光影响对文件200的成像效果,改善字符识别的结果。由于相机112的拍摄条件是稳定且可控的,所以相机112的成像效果可以得到最大程度的改善并且对于文件具有更好的字符识别结果。
[0032]处理器120被配置为经由电缆或无线地连接到相机112,控制相机112的工作并从相机112接收所拍摄的字符的图像。此外,处理器120被配置为从拍摄的图像识别文件200上的字符。根据需要,处理器120可以设置在暗箱110内部或暗箱110外部。此外,在本公开的一个或多个实施例中,处理器120可以位本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符识别系统,包括:暗箱,用于遮挡外界光线;文件托盘,设置在暗箱内并用于接收包含待识别的字符的文件;相机,设置在暗箱内并配置成拍摄文件上的字符的图像;和处理器,被配置为从相机接收所拍摄的图像并从所拍摄的图像识别字符。2.如权利要求1所述的系统,其中,所述字符的识别由所述处理器使用经训练的神经网络来执行。3.如权利要求2所述的系统,其中,经训练的神经网络是预先通过多个文件的图像和每个文件中包含的相应字符来训练的。4.如权利要求2所述的系统,其中,不能正确识别其中的字符的文件的图像和相应的字符被提供给经训练的神经网络,以更新神经网络。5.如权利要求1所述的系统,其中,所识别的字符被存储在能够被访问的表格中。6.如权利要求1所述的系统,其中,所述处理器包括以下中的至少一个:多线程处理器;和图形处理单元。7.如权利要求1所述的系统,其中,所述相机是具有固定焦距的相机。8.如权利要求1所述的系统,还包括光源,该光源设置在暗箱内并且被配置为照明文件上的所述字符。9.如权利要求1所述的系统,还包括显示器,并且在显示器上,所识别的字符被显示在所拍摄的图像中的字符附近。10.如权利要求1所述的系统,其中,所述处理器还被配置为在识别字符之前对所拍摄的图像执行图像处理,其中该图像处理包括以下中的至少一个:提取处理,以提取所拍摄的图像的感兴趣区域;镜像处理,以获得所拍摄的图像的镜像图像;降噪处理,以减少所拍摄的图像中的噪声;灰度化处理,以将所拍摄的图像转换为灰度图像;二值化处理,以将所拍摄的图像转换为二值化图像;形态学处理,以突出所拍摄的图像中的字符的轮廓;图像特征检测处理,以检测所拍摄的图像中的字符的区域;去旋转处理,以调整所拍摄的图像中的字符的方向;归一化处理,以将所拍摄的图像中的字符的尺寸调整为彼此一致;以及分割处理,以从所拍摄的图像获得每个字符的图像。11.如权利要求10所述的系统,其中,所述分割处理包括在所述字符的区域上滑动一个窗口并且在该窗口中仅包括一个字符时将该字符的图像分割出来,...

【专利技术属性】
技术研发人员:任家超张阳张文浩
申请(专利权)人:华晨宝马汽车有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1