文字检测识别方法、装置、设备与计算机可读存储介质制造方法及图纸

技术编号:35025797 阅读:14 留言:0更新日期:2022-09-24 22:57
本发明专利技术公开了一种文字检测识别方法、装置、设备与计算机可读存储介质,属于文字识别技术领域。本发明专利技术通过获取文本图像,对文本图像进行文本行检测和单字符检测,输出文本行检测结果与单字符检测结果,再基于文本行检测结果和单字符检测结果,进行文字内容识别,并生成识别结果。本发明专利技术通过在一个文字检测过程中,进行文本行及单字符两种细粒度的文字检测,易处理具有倾斜角度、多方向文本及弯曲文字的排序与识别,相较于仅对单字符进行识别具有更高的字符识别准确率,能够提升文字识别的精度。精度。精度。

【技术实现步骤摘要】
文字检测识别方法、装置、设备与计算机可读存储介质


[0001]本专利技术涉及文字识别
,尤其涉及文字检测识别方法、装置、设备与计算机可读存储介质。

技术介绍

[0002]文字检测与识别在文档图像的智能审录、文档比对以及图像文字检索等方面有着广阔的应用前景。智能审录、文档比对及图像文字检索,都要求文字检测与识别模型能够较精确地检测到图像中的单个字符的文字,并识别其文字内容,最后按需将识别到的多个单字符组织文本行,最终还原文档,以便确定文字在图像文档中的具体位置。
[0003]相关技术中在进行单字符文字检测与识别时,通常采用普通文本检测算法,以字符级别的标注信息进行训练,进行单字符文字检测。然后对文字检测算法检测到的一系列单个文字进行识别,并将文字按行排序以还原文档。该方案采用分治法将文字检测与识别分离,容易实现,但容易造成单字符检测与识别不准确、文本行排序困难的缺点。

技术实现思路

[0004]本专利技术的主要目的在于提供一种文字检测识别方法、装置、设备与计算机可读存储介质,旨在解决现有技术中文字检测与识别精度较差、文本行排序困难的问题。
[0005]为实现上述目的,本专利技术提供一种文字检测识别方法,所述文字检测识别方法包括以下步骤:
[0006]获取文本图像;
[0007]对所述文本图像进行文本行检测和单字符检测,输出文本行检测结果与单字符检测结果;
[0008]基于所述文本行检测结果和所述单字符检测结果,进行文字内容识别,并生成识别结果。
[0009]可选地,所述对所述文本图像进行文本行检测和单字符检测,输出文本行检测结果与单字符检测结果的步骤之后,所述方法还包括:
[0010]根据所述文本行检测结果与所述单字符检测结果,将所述单字符检测结果中的单字符检测框按文本行进行分组;
[0011]根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果。
[0012]可选地,所述根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果的步骤包括:
[0013]根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序;
[0014]检测所述排序后的单字符检测框的尺寸和方向,按行对所述尺寸和方向进行归一化处理,生成修正后的单字符检测结果。
[0015]可选地,所述根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果的步骤包括:
[0016]确认所述文本行检测结果是否为弯曲文本;
[0017]若是,则对所述文本行检测结果进行尺寸修改,生成缩小后的文本行方向;
[0018]根据所述文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果。
[0019]可选地,所述基于所述文本行检测结果和所述单字符检测结果,进行文字内容识别,并生成识别结果的步骤包括:
[0020]对所述文本行检测结果进行文本内容识别,生成文本行字符识别结果;
[0021]判断所述文本行字符识别结果是否与所述单字符检测结果中单字符检测框的位置对齐;
[0022]若是,则基于文本行字符识别结果生成识别结果。
[0023]可选地,所述判断所述文本行字符识别结果是否与所述单字符检测结果中单字符检测框的位置对齐的步骤之后,所述方法包括:
[0024]若否,则基于所述单字符检测结果进行文字识别,生成单字符识别结果;
[0025]根据所述单字符检测框与所述单字符识别结果,生成单字符字符串;
[0026]计算所述单字符字符串与所述文本行字符检测结果中对应的文本行字符串之间的编辑距离,并获取相应的编辑操作;
[0027]执行所述编辑操作,将所述文本行识别结果与所述单字符检测框的位置对齐,生成识别结果。
[0028]可选地,所述对所述文本图像进行文本行检测和单字符检测,输出文本行检测结果与单字符检测结果的步骤包括:
[0029]通过双分支文字检测模型,对所述文本图像分别进行文本行检测和单字符检测,预测得到文本行概率图与阈值图、单字符概率图与阈值图,并进行可微分二值化,分别得到文本行二值化概率图与单字符二值化概率图;
[0030]对所述文本行二值化概率图与所述单字符二值化概率图进行后处理,得到所述文本行检测结果与所述单字符检测结果。
[0031]此外,为实现上述目的,本专利技术还提供一种文字检测识别装置,所述装置包括:
[0032]获取模块,用于获取文本图像;
[0033]文字检测模块,用于对所述文本图像进行文本行检测和单字符检测,输出文本行检测结果与单字符检测结果;
[0034]文字识别模块,用于基于所述文本行检测结果和所述单字符检测结果,进行文字内容识别,并生成识别结果。
[0035]可选地,所述装置还包括:
[0036]单字符检测框排序纠正模块,用于根据所述文本行检测结果与所述单字符检测结果,将所述单字符检测结果中的单字符检测框按文本行进行分组;
[0037]根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果。
[0038]可选地,所述单字符检测框排序纠正模块还用于:
[0039]根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序;
[0040]检测所述排序后的单字符检测框的尺寸和方向,按行对所述尺寸和方向进行归一化处理,生成修正后的单字符检测结果。
[0041]可选地,所述单字符检测框排序纠正模块还用于:
[0042]确认所述文本行检测结果是否为弯曲文本;
[0043]若是,则对所述文本行检测结果进行尺寸修改,生成缩小后的文本行方向;
[0044]根据所述文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果。
[0045]可选地,所述装置还包括:
[0046]字符对齐模块,用于对所述文本行检测结果进行文本内容识别,生成文本行字符识别结果;
[0047]判断所述文本行字符识别结果是否与所述单字符检测结果中单字符检测框的位置对齐;
[0048]若是,则基于文本行字符识别结果生成识别结果。
[0049]可选地,所述字符对齐模块还用于:
[0050]若否,则基于所述单字符检测结果进行文字识别,生成单字符识别结果;
[0051]根据所述单字符检测框与所述单字符识别结果,生成单字符字符串;
[0052]计算所述单字符字符串与所述文本行字符检测结果中对应的文本行字符串之间的编辑距离,并获取相应的编辑操作;
[0053]执行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字检测识别方法,其特征在于,所述文字检测识别方法包括以下步骤:获取文本图像;对所述文本图像进行文本行检测和单字符检测,输出文本行检测结果与单字符检测结果;基于所述文本行检测结果和所述单字符检测结果,进行文字内容识别,并生成识别结果。2.如权利要求1所述的文字检测识别方法,其特征在于,所述对所述文本图像进行文本行检测和单字符检测,输出文本行检测结果与单字符检测结果的步骤之后,所述方法还包括:根据所述文本行检测结果与所述单字符检测结果,将所述单字符检测结果中的单字符检测框按文本行进行分组;根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果。3.如权利要求2所述的文字检测识别方法,其特征在于,所述根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果的步骤包括:根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序;检测所述排序后的单字符检测框的尺寸和方向,按行对所述尺寸和方向进行归一化处理,生成修正后的单字符检测结果。4.如权利要求2所述的文字检测识别方法,其特征在于,所述根据所述文本行检测结果中的文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果的步骤包括:确认所述文本行检测结果是否为弯曲文本;若是,则对所述文本行检测结果进行尺寸修改,生成缩小后的文本行方向;根据所述文本行方向,在分组组内将所述单字符检测框按所述文本行方向进行排序,生成修正后的单字符检测结果。5.如权利要求1所述的文字检测识别方法,其特征在于,所述基于所述文本行检测结果和所述单字符检测结果,进行文字内容识别,并生成识别结果的步骤包括:对所述文本行检测结果进行文本内容识别,生成文本行字符识别结果;判断所述文本行字符识别结果是否与所述单字符检测结果中单字...

【专利技术属性】
技术研发人员:廖明李国鸣陈洁彦钱学成
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1