字符识别方法及装置制造方法及图纸

技术编号:14130678 阅读:61 留言:0更新日期:2016-12-09 19:16
本发明专利技术的实施例提供了一种字符识别方法及装置。所述字符识别方法包括:获取待识别字符区域的至少两帧图像;对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。根据本发明专利技术实施例的字符识别方法及装置利用图像的时空冗余和互补特性,基于至少两帧图像的融合进行字符识别,与基于单帧图像的字符识别相比,可以取得更高的识别精度,且在存在噪声、模糊以及光照不佳等情况下,具有更好的适应性。

【技术实现步骤摘要】

本专利技术涉及字符识别
,更具体地涉及一种字符识别方法及装置
技术介绍
随着电子商务的迅猛发展,网上的交易越来越多,商家与商家之间、商家与客户之间等等常常进行各种交易,在这样的交易中,网上支付成为一种重要的支付手段。在进行网上支付时,用户通常需要手动输入银行卡或信用卡等多达十几位的卡号,操作十分不便利,直接影响用户体验。目前,可以采用字符识别方法或系统对银行卡或信用卡等卡号之类的字符串进行扫描和识别,以代替人工手动输入,但是其精度尚未达到非常令人满意的程度,特别是在光照条件不佳或待识别区域存在复杂花纹时,最终的识别精度可能会大幅降低,或者需要花费较长的时间才能给出识别结果。在这些情况下,用户仍不得不采取手动输入方式。因此,需要较高精度的字符识别方法或系统以改善用户体验。
技术实现思路
考虑到上述问题而提出了本专利技术。本专利技术提供了一种字符识别方法及装置,其利用图像的时空冗余和互补特性,基于至少两帧图像的融合进行字符识别,可以提高字符识别的精度。根据本专利技术一方面,提供了一种字符识别方法,所述字符识别方法包括:获取待识别字符区域的至少两帧图像;对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。根据本专利技术的一个实施例,所述至少两帧图像为连续帧图像。根据本专利技术的一个实施例,对每一帧图像的字符识别还包括生成每一帧图像的字符识别结果的置信度。根据本专利技术的一个实施例,对所述至少两帧图像的字符识别结果的融合基于所述每一帧图像的字符识别结果以及所述每一帧图像的字符识别结果的置信度。根据本专利技术的一个实施例,所述对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果包括:对预设目标函数进行迭代计算,以得到所述预设目标函数的最小值,其中,所述预设目标函数是一个关于预设字符变量的函数,且该函数中包括所述至少两帧图像中各帧图像的字符识别结果与预设字符变量之间的编辑距离、以及对应帧图像的字符识别结果的置信度;将所述预设目标函数取得最小值时对应的所述预设字符变量的值作为所述最佳字符识别结果输出。示例性地,所述最佳字符识别结果通过下式进行计算: s * = argmin s Σ j = 1 N w j d ( s , s j ) ]]>其中,s*表示所述最佳字符识别结果,N表示所采集的图像的总帧数,sj表示第j帧图像的字符识别结果,wj表示第j帧图像的字符识别结果的置信度,并且d(s,sj)定义为sj到s的编辑距离,s为字符变量。根据本专利技术的一个实施例,所述对预设目标函数进行迭代计算包括:通过梯度下降法对所述预设目标函数进行迭代计算。根据本专利技术另一方面,提供了一种字符识别装置,所述字符识别装置包括:图像采集模块,用于获取待识别字符区域的至少两帧图像;字符识别模块,用于对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及融合模块,用于对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。根据本专利技术的一个实施例,所述至少两帧图像为连续帧图像。根据本专利技术的一个实施例,所述字符识别模块还用于生成每一帧图像的字符识别结果的置信度。根据本专利技术的一个实施例,所述融合模块基于所述每一帧图像的字符识别结果以及所述每一帧图像的字符识别结果的置信度对所述至少两帧图像的字符识别结果进行融合。根据本专利技术的一个实施例,所述融合模块包括:计算单元,用于对预设目标函数进行迭代计算,以得到所述预设目标函数的最小值,其中,所述预设目标函数是一个关于预设字符变量的函数,且该函数中包括所述至少两帧图像中各帧图像的字符识别结果与预设字符变量之间的编辑距离、以及对应帧图像的字符识别结果的置信度;输出单元,用于将所述预设目标函数取得最小值时对应的所述预设字符变量的值作为所述最佳字符识别结果输出。示例性地,所述融合模块用于通过下式计算所述最佳字符识别结果: s * = argmin s Σ j = 1 N w j d ( s , s j ) ]]>其中,s*表示所述最佳字符识别结果,N表示所采集的图像的总帧数,sj表示第j帧图像的字符识别结果,wj表示第j帧图像的字符识别结果的置信度,并且d(s,sj)定义为sj到s的编辑距离,s为字符变量。根据本专利技术的一个实施例,所述计算单元用于通过梯度下降法对所述预设目标函数进行迭代计算。根据本专利技术实施例的字符识别方法及装置利用图像的时空冗余和互补特性,基于至少两帧图像的融合进行字符识别,与基于单帧图像的字符识别相比,可以取得更高的识别精度,且在存在噪声、模糊以及光照不佳等情况下,具有更好的适应性。附图说明通过结合附图对本专利技术实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与本专利技术实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1是用于实现根据本专利技术实施例的字符识别方法和装置的示例电子设备的示意性框图;图2是根据本专利技术实施例的字符识别方法的示意性流程图;图3是根据本专利技术实施例的字符识别装置的示意性框图;以及图4是根据本专利技术实施例的字符识别系统的示意性框图。具体实施方式为了使得本专利技术的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本专利技术的示例实施例。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。基于本专利技术中描述的本专利技术实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本专利技术的保护范围之内。首先,参照图1来描述用于实现本专利技术实施例的字符识别方法和装置的示例电子设备100。如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108以及图像传感器110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子本文档来自技高网...
字符识别方法及装置

【技术保护点】
一种字符识别方法,其特征在于,所述字符识别方法包括:获取待识别字符区域的至少两帧图像;对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。

【技术特征摘要】
1.一种字符识别方法,其特征在于,所述字符识别方法包括:获取待识别字符区域的至少两帧图像;对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。2.根据权利要求1所述的字符识别方法,其特征在于,所述至少两帧图像为连续帧图像。3.根据权利要求1所述的字符识别方法,其特征在于,对每一帧图像的字符识别还包括生成每一帧图像的字符识别结果的置信度。4.根据权利要求3所述的字符识别方法,其特征在于,对所述至少两帧图像的字符识别结果的融合基于所述每一帧图像的字符识别结果以及所述每一帧图像的字符识别结果的置信度。5.根据权利要求3或4所述的字符识别方法,其特征在于,所述对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果包括:对预设目标函数进行迭代计算,以得到所述预设目标函数的最小值,其中,所述预设目标函数是一个关于预设字符变量的函数,且该函数中包括所述至少两帧图像中各帧图像的字符识别结果与预设字符变量之间的编辑距离、以及对应帧图像的字符识别结果的置信度;将所述预设目标函数取得最小值时对应的所述预设字符变量的值作为所述最佳字符识别结果输出。6.根据权利要求3或4所述的字符识别方法,其特征在于,所述最佳字符识别结果通过下式进行计算: s * = argmin s Σ j = 1 N w j d ( s , s j ) ]]>其中,s*表示所述最佳字符识别结果,N表示所采集的图像的总帧数,sj表示第j帧图像的字符识别结果,wj表示第j帧图像的字符识别结果的置信度,并且d(s,sj)定义为sj到s的编辑距离,s为字符变量。7.根据权利要求5所述的字符识别方法,其特征在于,所述对预设目标函数进行迭代计算包括:通过梯度下降法对所述预设目标函数进行迭代计算。8.一种字符识别...

【专利技术属性】
技术研发人员:姚聪周舒畅周昕宇何蔚然印奇
申请(专利权)人:北京旷视科技有限公司北京小孔科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1