【技术实现步骤摘要】
本专利技术涉及字符识别
,更具体地涉及一种字符识别方法及装置。
技术介绍
随着电子商务的迅猛发展,网上的交易越来越多,商家与商家之间、商家与客户之间等等常常进行各种交易,在这样的交易中,网上支付成为一种重要的支付手段。在进行网上支付时,用户通常需要手动输入银行卡或信用卡等多达十几位的卡号,操作十分不便利,直接影响用户体验。目前,可以采用字符识别方法或系统对银行卡或信用卡等卡号之类的字符串进行扫描和识别,以代替人工手动输入,但是其精度尚未达到非常令人满意的程度,特别是在光照条件不佳或待识别区域存在复杂花纹时,最终的识别精度可能会大幅降低,或者需要花费较长的时间才能给出识别结果。在这些情况下,用户仍不得不采取手动输入方式。因此,需要较高精度的字符识别方法或系统以改善用户体验。
技术实现思路
考虑到上述问题而提出了本专利技术。本专利技术提供了一种字符识别方法及装置,其利用图像的时空冗余和互补特性,基于至少两帧图像的融合进行字符识别,可以提高字符识别的精度。根据本专利技术一方面,提供了一种字符识别方法,所述字符识别方法包括:获取待识别字符区域的至少两帧图像;对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。根据本专利技术的一个实施例,所述至少两帧图像为连续帧图像。根据本专利技术的一个实施例,对每一帧图像的字符识别还包括生成每一帧图像的字符识别结果的置信度。根据本专利技术的一个实施例,对所述至少两帧图像的字符识别结果的融合基于所述每一帧图像的字符识别 ...
【技术保护点】
一种字符识别方法,其特征在于,所述字符识别方法包括:获取待识别字符区域的至少两帧图像;对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。
【技术特征摘要】
1.一种字符识别方法,其特征在于,所述字符识别方法包括:获取待识别字符区域的至少两帧图像;对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。2.根据权利要求1所述的字符识别方法,其特征在于,所述至少两帧图像为连续帧图像。3.根据权利要求1所述的字符识别方法,其特征在于,对每一帧图像的字符识别还包括生成每一帧图像的字符识别结果的置信度。4.根据权利要求3所述的字符识别方法,其特征在于,对所述至少两帧图像的字符识别结果的融合基于所述每一帧图像的字符识别结果以及所述每一帧图像的字符识别结果的置信度。5.根据权利要求3或4所述的字符识别方法,其特征在于,所述对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果包括:对预设目标函数进行迭代计算,以得到所述预设目标函数的最小值,其中,所述预设目标函数是一个关于预设字符变量的函数,且该函数中包括所述至少两帧图像中各帧图像的字符识别结果与预设字符变量之间的编辑距离、以及对应帧图像的字符识别结果的置信度;将所述预设目标函数取得最小值时对应的所述预设字符变量的值作为所述最佳字符识别结果输出。6.根据权利要求3或4所述的字符识别方法,其特征在于,所述最佳字符识别结果通过下式进行计算: s * = argmin s Σ j = 1 N w j d ( s , s j ) ]]>其中,s*表示所述最佳字符识别结果,N表示所采集的图像的总帧数,sj表示第j帧图像的字符识别结果,wj表示第j帧图像的字符识别结果的置信度,并且d(s,sj)定义为sj到s的编辑距离,s为字符变量。7.根据权利要求5所述的字符识别方法,其特征在于,所述对预设目标函数进行迭代计算包括:通过梯度下降法对所述预设目标函数进行迭代计算。8.一种字符识别...
【专利技术属性】
技术研发人员:姚聪,周舒畅,周昕宇,何蔚然,印奇,
申请(专利权)人:北京旷视科技有限公司,北京小孔科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。