文本识别模型生成方法、文本识别方法、设备及存储介质技术

技术编号:35736712 阅读:21 留言:0更新日期:2022-11-26 18:39
文本识别模型生成方法、文本识别方法、设备及存储介质,所述文本识别方法包括:获取待识别的文本行图像;对所述文本行图像采用训练完成的文本行识别模型进行行文本识别,得到文本行识别结果;在确定所述文本行识别结果中任一字符的置信度小于预设的置信度阈值或所述字符的能量大于预设的能量阈值时,以所述文本行图像中的相应字符为中心,裁切预设宽度的字符子图像;对于各字符子图像,采用训练完成的单字检测和识别模型进行单字检测和识别,输出相应的字符识别结果;结合所述文本行识别结果和相应的字符识别结果,得到所述文本行图像的字符识别结果。上述方案对于算力有限的电子设备,能够提高文本识别的精度及效率。能够提高文本识别的精度及效率。能够提高文本识别的精度及效率。

【技术实现步骤摘要】
文本识别模型生成方法、文本识别方法、设备及存储介质


[0001]本说明书实施例涉及数据处理
,尤其涉及文本识别模型生成方法、文本识别方法、设备及存储介质。

技术介绍

[0002]近年来,伴随着人工智能(Artificial Intelligence,AI)领域技术的不断发展和创新,光学字符识别(Optical Character Recognition,OCR)取得了巨大的突破,并成为金融、交通、物流、教育、政务等各个垂直行业数字转型、智能升级及融合创新的重要基础能力。由于移动互联网的日益成熟和产业互联网的加速发展,OCR的服务载体、形式呈现出多样化特征,兼顾性能和效率的离线OCR已成为未来技术发展的趋势之一。离线OCR成为继公有云应用程序接口(Application Program Interface,API)、私有化部署之后的一种全新产品形态,是对泛OCR体系边界的拓展,相比在线服务具有低成本部署、零流量消耗、保护隐私、所见即所得等优势。
[0003]教育智能硬件通过集成AI算法、软件、内容等形式多样化的产品功能,帮助学生获得本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本识别模型生成方法,其中,包括:分别获取文本行图像训练集和字符图像训练集;将所述文本行图像训练集输入预设的文本行识别模型,对所述文本行识别模型进行训练,将所述字符图像训练集输入预设的单字检测和识别模型,对所述单字检测和识别模型进行训练;获取文本行图像测试集,输入所述文本行识别模型,输出文本行识别结果;评估所述文本行识别结果中各字符的置信度和能量;在确定所述文本行识别结果中任一字符的置信度小于预设的置信度阈值或所述字符的能量大于预设的能量阈值时,以所述文本行图像中的相应字符为中心,裁切预设宽度的字符测试子图像;对于各字符测试子图像,输入所述单字检测和识别模型,输出相应的字符识别结果;结合所述文本行识别结果和相应的字符识别结果,得到所述文本行图像测试集的字符识别测试结果;基于所述字符识别测试结果是否达到预设的性能评估指标确定是否对所述文本行识别模型以及所述单字检测和识别模型继续进行训练,直至所述字符识别测试结果达到预设的性能评估指标。2.根据权利要求1所述的方法,其中,所述分别获取文本行图像训练集和字符图像训练集,包括:将第一文本行图像训练集和第二文本行图像训练集按照相应训练批次预设的第一混合比例进行混合,得到所述文本行图像训练集;其中,所述第一文本行图像训练集为对采集的真实文本图像进行裁切得到;所述第二文本行图像训练集为通过收集不同字体的字库,并按照文本行中文字的排布规则合成文本行得到;将第一字符图像训练集和第二字符图像训练集按照相应训练批次预设的第二混合比例进行混合,得到所述字符图像训练集;其中,所述第一字符图像训练集为对采集的真实文本图像进行裁切得到;所述第二字符图像训练集为通过收集不同字体的字库,并按照文本行中文字的排布规则合成文本图像后进行裁切得到。3.根据权利要求2所述的方法,其中,将第一文本行图像训练集和第二文本行图像训练集按照相应训练批次预设的第一混合比例进行混合,以及将第一字符图像训练集和第二字符图像训练集按照相应训练批次预设的第二混合比例进行混合,使得经所述文本行图像训练集训练得到的所述文本行识别模型和经所述字符图像训练集训练得到的所述单字检测和识别模型达到预设的泛化性能指标阈值。4.根据权利要求1所述的方法,其中,所述文本行识别模型包括:卷积循环神经网络。5.根据权利要求1

4任一项所述的方法,其中,还包括:对所述文本行图像训练集和字符图像训练集执行图像增广操作。6.根据权利要求5所述的方法,其中,所述对所述文本行图像训练集和字符图像训练集执行图像增广操作,包括:对所述文本行图像训练集和字符图像训练集按照相应训练批次设置的超参数...

【专利技术属性】
技术研发人员:朱远志丁威汤俊何梦超姚聪刘腾张洁靖朱雅丽
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1