基于深度学习的字体识别方法、系统、设备及存储介质技术方案

技术编号：39051190 阅读：13 留言：0更新日期：2023-10-12 19:43

本发明专利技术提供了基于深度学习的字体识别方法、系统、设备及存储介质，该方法包括：通过光符识别算法对输入图片进行文本检测识别，获得至少一文本图像区域；通过目标检测算法对文本图像区域进行分割，获得文字图像区域；基于文字图像区域的字符的对应的文字调取对应的预设商业字体图案，作为商业字体集合，预设商业字体图案包括若干收费字库的文字图案；将单个字符的对应的文字图像区域与商业字体集合中的每一个商业字体图案进行逐个图像比对，识别出是否使用了收费字库的文字图案。本发明专利技术能够通过将文本行分割为单个字符，可以实现对字符的字体识别更加准确及全面，从而全自动实现识别图片文本字体类别并判断是否属于商业字体。别图片文本字体类别并判断是否属于商业字体。别图片文本字体类别并判断是否属于商业字体。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的字体识别方法、系统、设备及存储介质

[0001]本专利技术涉及图片文本识别处理领域，具体地说，涉及基于深度学习的字体识别方法、系统、设备及存储介质。

技术介绍

[0002]目前，在各类设计稿、业务或第三方上传的图片中通常包含文字信息，这些文字存在其所使用的字体有商业侵权的风险，从而对公司带来不必要的损失。面对以上存在的潜在风险，如何智能地识别图片中所有文本以及文本字体并判断文本字体是否为商业字体成为急需解决的问题。
[0003]现有的OCR广泛应用于证件识别、票据识别以及文档识别等文字识别场景中。通常，以上任务对于OCR的准确率要求较高。同时需要满足业务对于推理时间的需求。OCR的主要方法分为端到端和两阶段(文本检测+文本识别)方法。针对文本检测方法，主要分为基于回归的文本检测方法和基于分割的文本检测方法。但是，现有的OCR无法对图片字体使用的字体进行准确识别。
[0004]因此，本专利技术提供了一种基于深度学习的字体识别方法、系统、设备及存储介质。

技术实现思路

[0005]针对现有技术中的问题，本专利技术的目的在于提供基于深度学习的字体识别方法、系统、设备及存储介质，克服了现有技术的困难，能够通过将文本行分割为单个字符，可以实现对字符的字体识别更加准确及全面，从而全自动实现识别图片文本字体类别并判断是否属于商业字体。
[0006]本专利技术的实施例提供一种基于深度学习的字体识别方法，包括以下步骤：
[0007]S110、通过光符识别算法对输入图片进行文...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的字体识别方法，其特征在于，包括以下步骤：S110、通过光符识别算法对输入图片进行文本检测识别，获得至少一文本图像区域；S120、通过目标检测算法对所述文本图像区域进行分割，获得文字图像区域；S130、基于所述文字图像区域的字符的对应的文字调取对应的预设商业字体图案，作为商业字体集合，所述预设商业字体图案包括若干收费字库的文字图案；S140、将单个字符的对应的文字图像区域与所述商业字体集合中的每一个商业字体图案进行逐个图像比对，识别出是否使用了收费字库的文字图案。2.如权利要求1所述的基于深度学习的字体识别方法，其特征在于，所述步骤S110中，包括：S111、输入一包含文字图案的图片；S112、通过光符识别算法对图片进行识别，获得所述输入图片中至少一代表文本的文本图像区域和所述文本图像区域在所述输入图片中的平面坐标框。3.如权利要求2所述的基于深度学习的字体识别方法，其特征在于，所述光符检测识别是OCR识别算法。4.如权利要求1所述的基于深度学习的字体识别方法，其特征在于，所述步骤S120中，包括：S121、将每个所述文本图像区域通过目标检测算法进行单个字符的识别；S122、获得每个所述文本图像区域中代表单个文字的文字图像区域和所述文字图像区域在所述输入图片中的平面坐标框。5.如权利要求4所述的基于深度学习的字体识别方法，其特征在于，所述目标检测算法是YOLO识别算法。6.如权利要求1所述的基于深度学习的字体识别方法，其特征在于，所述步骤S140中，包括：S141、将所述单个字符的对应的文字图像区...

【专利技术属性】
技术研发人员：王嘉欣，陈辰，赵华，鞠剑勋，李健，
申请(专利权)人：上海携旅信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人