一种图片文字识别方法技术

技术编号:40543455 阅读:19 留言:0更新日期:2024-03-05 19:00
本发明专利技术公开了一种图片文字识别方法,包括以下步骤:S101:扩散方程图像增强,先使用相干增强各向异性扩散方程对图像进行增强;S201:FCOS‑VQ四边形目标检测,通过FCOS‑VQ四边形目标检测获得文本区域的四边形边界框;S301:文本特征对齐与识别,对四边形文本区域的特征进行提取,获得固定尺寸的特征图,最后对特征进行文本识别。本发明专利技术通过提出FCOS‑VQ网络,具有检测四边形边界框的能力。另外,使用两次双线性插值提取四边形文本区域的特征,这可以将任意方向的文本特征对齐为水平方向,从而简化了识别的难度,直接用CRNN和解耦文本解码器进行文本识别,在图片文字识别上的测试结果表明,提出的方法具有检测速度快和识别准确率高的特点。

【技术实现步骤摘要】

本专利技术属于计算机,尤其涉及一种图片文字识别方法


技术介绍

1、随着自动驾驶、机器翻译的快速发展和办公无纸化的潮流到来,文本识别成为了人们生活、学习和工作的得力助手。文本识别可以将纸质文档中的文字提取出来保存为电子文档,也可以将商品包装上的外语提取出来进行翻译,但是在某些工作中,仍然使用传统的人工方法录入和核对文本信息,文本识别对文字的清晰程度比较敏感,往往需要先对图片进行预处理。


技术实现思路

1、本专利技术目的在于提供一种图片文字识别方法,以解决
技术介绍
中所提出的技术问题。

2、为实现上述目的,本专利技术的具体技术方案如下:一种图片文字识别方法,包括以下步骤:

3、s101:扩散方程图像增强,先使用相干增强各向异性扩散方程对图像进行增强;

4、s201:fcos-vq四边形目标检测,通过fcos-vq四边形目标检测获得文本区域的四边形边界框;

5、s301:文本特征对齐与识别,对四边形文本区域的特征进行提取,获得固定尺寸的特征图,最后对特征进行文本识别。本文档来自技高网...

【技术保护点】

1.一种图片文字识别方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种图片文字识别方法,其特征在于:所述步骤S101中的方程建立如下:

3.根据权利要求1所述的一种图片文字识别方法,其特征在于:所述步骤S201中使用特征金字塔网络提取特征,令Fi∈RH*W*C表示FPN中的第i层特征图,s表示到这层的总步长,(x,y)是特征图Fi上的位置,它作为感受野的中心,对应于输入图片中的位置

4.根据权利要求1所述的一种图片文字识别方法,其特征在于:所述步骤S201中FCOS的检测头部包括边界框类别分支,中心度回归分支和矩形边界框回归分支;其中,...

【技术特征摘要】

1.一种图片文字识别方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种图片文字识别方法,其特征在于:所述步骤s101中的方程建立如下:

3.根据权利要求1所述的一种图片文字识别方法,其特征在于:所述步骤s201中使用特征金字塔网络提取特征,令fi∈rh*w*c表示fpn中的第i层特征图,s表示到这层的总步长,(x,y)是特征图fi上的位置,它作为感受野的中心,对应于输入图片中的位置

4.根据权利要求1所述的一种图片文字识别方法,其特征...

【专利技术属性】
技术研发人员:胡娟
申请(专利权)人:南京林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1