文字识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:31494047 阅读:30 留言:0更新日期:2021-12-18 12:31
本申请涉及人工智能技术领域,提出一种文字识别方法、装置、计算机设备及存储介质,其中方法包括:基于YOLO模型获取待识别文字对应的参考矩形图像;基于生成式对抗网络对所述参考矩形图像进行图像增强,得到目标矩形图像;基于直线检测模型从所述目标矩形图像中选取参考直线;获取所述目标矩形图像中每一行文字图像的虚拟下划线;基于所述虚拟下划线和所述参考直线确定所述行文字图像的倾斜角度;基于光学字符识别模型对所述倾斜角度对应的行文字图像进行文字识别。采用本申请,可提高文字识别的准确率。别的准确率。别的准确率。

【技术实现步骤摘要】
文字识别方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能
,主要涉及了一种文字识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]当前,很多场合中都有对图像中的文字进行检测的需求。例如,采集包含身份证,行驶证,驾驶证或者名片的图像,用于检测图像中的诸如姓名、编号或者职位等文字信息。然而,在一些电子文档(例如,便携式文档格式(Portable Document Format,PDF)文档等)对应的图像质量较差,导致文字的识别效率低。

技术实现思路

[0003]本申请实施例提供了一种文字识别方法、装置、计算机设备及存储介质,可提高文字识别的准确率。
[0004]第一方面,本申请实施例提供一种文字识别方法,其中:
[0005]基于YOLO模型获取待识别文字对应的参考矩形图像;
[0006]基于生成式对抗网络对所述参考矩形图像进行图像增强,得到目标矩形图像;
[0007]基于直线检测模型从所述目标矩形图像中选取参考直线;获取所述目标矩形图像中每一行文字图像的虚拟下划线;...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:基于YOLO模型获取待识别文字对应的参考矩形图像;基于生成式对抗网络对所述参考矩形图像进行图像增强,得到目标矩形图像;基于直线检测模型从所述目标矩形图像中选取参考直线;获取所述目标矩形图像中每一行文字图像的虚拟下划线;基于所述虚拟下划线和所述参考直线确定所述行文字图像的倾斜角度;基于光学字符识别模型对所述倾斜角度对应的行文字图像进行文字识别。2.根据权利要求1所述的方法,其特征在于,所述基于直线检测模型从所述目标矩形图像中选取参考直线,包括:基于直线检测模型获取所述目标矩形图像中的多条第一直线;从所述多条第一直线中选取第二直线;对所述第二直线进行聚类,得到所述目标矩形图像中的参考直线。3.根据权利要求2所述的方法,其特征在于,所述从所述多条第一直线中选取第二直线,包括:建立所述目标矩形图像的坐标系;基于所述坐标系获取所述第一直线的长度和角度;从所述第一直线中选取所述长度大于预设长度,且所述角度属于预设角度范围的第一直线,得到第二直线。4.根据权利要求3所述的方法,其特征在于,所述获取所述目标矩形图像中每一行文字图像的虚拟下划线,包括:确定所述待识别文字的语种;基于所述坐标系获取所述目标矩形图像中每一文字的坐标信息;基于所述坐标信息和所述语种确定所述文字的预设间隔;基于所述预设间隔和所述坐标信息在所述文字的下方画出子线段;对所述子线段进行调整,得到所述目标矩形图像中每一行文字图像的虚拟下划线。5.根据权利要求4所述的方法,其特征在于,在所述基于光学字符识别模型对所述倾斜角度对应的行文字图像进行文字识别之前,所述方法还包括:确定所述待识别文字的场景信息;基于所述场景信息确定所述待识别文字的识别精度;从预设光学字符识别模型库中,选取与所述语种、所述识别精度和所述倾斜角度对应的所述光学字符识别模型。6.根据权利要求1

5中任一项所述的方法,其特征在于,所述基于所述...

【专利技术属性】
技术研发人员:杨冬振
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1