基于深度学习的字体识别方法、系统、设备及存储介质技术方案

技术编号:39051190 阅读:13 留言:0更新日期:2023-10-12 19:43
本发明专利技术提供了基于深度学习的字体识别方法、系统、设备及存储介质,该方法包括:通过光符识别算法对输入图片进行文本检测识别,获得至少一文本图像区域;通过目标检测算法对文本图像区域进行分割,获得文字图像区域;基于文字图像区域的字符的对应的文字调取对应的预设商业字体图案,作为商业字体集合,预设商业字体图案包括若干收费字库的文字图案;将单个字符的对应的文字图像区域与商业字体集合中的每一个商业字体图案进行逐个图像比对,识别出是否使用了收费字库的文字图案。本发明专利技术能够通过将文本行分割为单个字符,可以实现对字符的字体识别更加准确及全面,从而全自动实现识别图片文本字体类别并判断是否属于商业字体。别图片文本字体类别并判断是否属于商业字体。别图片文本字体类别并判断是否属于商业字体。

【技术实现步骤摘要】
基于深度学习的字体识别方法、系统、设备及存储介质


[0001]本专利技术涉及图片文本识别处理领域,具体地说,涉及基于深度学习的字体识别方法、系统、设备及存储介质。

技术介绍

[0002]目前,在各类设计稿、业务或第三方上传的图片中通常包含文字信息,这些文字存在其所使用的字体有商业侵权的风险,从而对公司带来不必要的损失。面对以上存在的潜在风险,如何智能地识别图片中所有文本以及文本字体并判断文本字体是否为商业字体成为急需解决的问题。
[0003]现有的OCR广泛应用于证件识别、票据识别以及文档识别等文字识别场景中。通常,以上任务对于OCR的准确率要求较高。同时需要满足业务对于推理时间的需求。OCR的主要方法分为端到端和两阶段(文本检测+文本识别)方法。针对文本检测方法,主要分为基于回归的文本检测方法和基于分割的文本检测方法。但是,现有的OCR无法对图片字体使用的字体进行准确识别。
[0004]因此,本专利技术提供了一种基于深度学习的字体识别方法、系统、设备及存储介质。

技术实现思路

[0005]针对现有技术中的问题,本专利技术的目的在于提供基于深度学习的字体识别方法、系统、设备及存储介质,克服了现有技术的困难,能够通过将文本行分割为单个字符,可以实现对字符的字体识别更加准确及全面,从而全自动实现识别图片文本字体类别并判断是否属于商业字体。
[0006]本专利技术的实施例提供一种基于深度学习的字体识别方法,包括以下步骤:
[0007]S110、通过光符识别算法对输入图片进行文本检测识别,获得至少一文本图像区域;
[0008]S120、通过目标检测算法对所述文本图像区域进行分割,获得文字图像区域;
[0009]S130、基于所述文字图像区域的字符的对应的文字调取对应的预设商业字体图案,作为商业字体集合,所述预设商业字体图案包括若干收费字库的文字图案;
[0010]S140、将单个字符的对应的文字图像区域与所述商业字体集合中的每一个商业字体图案进行逐个图像比对,识别出是否使用了收费字库的文字图案。
[0011]优选地,所述步骤S110中,包括:
[0012]S111、输入一包含文字图案的图片;
[0013]S112、通过光符识别算法对图片进行识别,获得所述输入图片中至少一代表文本的文本图像区域和所述文本图像区域在所述输入图片中的平面坐标框。
[0014]优选地,所述光符检测识别是OCR识别算法。
[0015]优选地,所述步骤S120中,包括:
[0016]S121、将每个所述文本图像区域通过目标检测算法进行单个字符的识别;
[0017]S122、获得每个所述文本图像区域中代表单个文字的文字图像区域和所述文字图像区域在所述输入图片中的平面坐标框。
[0018]优选地,所述目标检测算法是YOLO识别算法。
[0019]优选地,所述步骤S140中,包括:
[0020]S141、将所述单个字符的对应的文字图像区域与所述商业字体集合中的每一个商业字体图案进行逐个图像比对,获得相似度值;
[0021]S142、当图像比对的相似度大于预设值时,则所述输入图片中使用了预设商业字体图案。
[0022]优选地,还包括:
[0023]S150、每种所述收费字库的字体对应与预设的收款账户,统计使用收费字库的总字数,基于预设字体的字体单价获得的使用费,所述输入图片的预设账户向所述预设商业字体图案的收款账户支付所述使用费。
[0024]本专利技术的实施例还提供一种基于深度学习的字体识别系统,用于实现上述的基于深度学习的字体识别方法,所述基于深度学习的字体识别系统包括:
[0025]文本检测模块,通过光符识别算法对输入图片进行文本检测识别,获得至少一文本图像区域;
[0026]文字检测模块,通过目标检测算法对所述文本图像区域进行识别,获得文字图像区域;
[0027]比对集合模块,基于所述单个字符的对应的文字调取对应的预设商业字体图案,作为商业字体集合,所述预设商业字体图案包括若干收费字库的文字图案;
[0028]图案比对模块,将所述单个字符的对应的文字图像区域与所述商业字体集合中的每一个商业字体图案进行逐个图像比对,识别出是否使用了收费字库的文字图案。
[0029]本专利技术的实施例还提供一种基于深度学习的字体识别设备,包括:
[0030]处理器;
[0031]存储器,其中存储有所述处理器的可执行指令;
[0032]其中,所述处理器配置为经由执行所述可执行指令来执行上述基于深度学习的字体识别方法的步骤。
[0033]本专利技术的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于深度学习的字体识别方法的步骤。
[0034]本专利技术的目的在于提供基于深度学习的字体识别方法、系统、设备及存储介质,能够通过将文本行分割为单个字符,可以实现对字符的字体识别更加准确及全面,从而全自动实现识别图片文本字体类别并判断是否属于商业字体。
附图说明
[0035]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。
[0036]图1是本专利技术的基于深度学习的字体识别方法的流程图。
[0037]图2是本专利技术的基于深度学习的字体识别方法中加速矩阵乘法的整体流程框图。
[0038]图3是本专利技术的基于深度学习的字体识别方法的实施过程示意图。
[0039]图4是本专利技术的基于深度学习的字体识别设备的结构示意图。
[0040]图5是本专利技术的基于深度学习的字体识别设备的结构示意图。
[0041]图6是本专利技术一实施例的计算机可读存储介质的结构示意图。
具体实施方式
[0042]以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本申请所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用系统,本申请中的各项细节也可以根据不同观点与应用系统,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0043]下面以附图为参考,针对本申请的实施例进行详细说明,以便本申请所属
的技术人员能够容易地实施。本申请可以以多种不同形态体现,并不限定于此处说明的实施例。
[0044]在本申请的表示中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的表示意指结合该实施例或示例表示的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,表示的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本申请中表示的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0045]此外,术语“第一”、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的字体识别方法,其特征在于,包括以下步骤:S110、通过光符识别算法对输入图片进行文本检测识别,获得至少一文本图像区域;S120、通过目标检测算法对所述文本图像区域进行分割,获得文字图像区域;S130、基于所述文字图像区域的字符的对应的文字调取对应的预设商业字体图案,作为商业字体集合,所述预设商业字体图案包括若干收费字库的文字图案;S140、将单个字符的对应的文字图像区域与所述商业字体集合中的每一个商业字体图案进行逐个图像比对,识别出是否使用了收费字库的文字图案。2.如权利要求1所述的基于深度学习的字体识别方法,其特征在于,所述步骤S110中,包括:S111、输入一包含文字图案的图片;S112、通过光符识别算法对图片进行识别,获得所述输入图片中至少一代表文本的文本图像区域和所述文本图像区域在所述输入图片中的平面坐标框。3.如权利要求2所述的基于深度学习的字体识别方法,其特征在于,所述光符检测识别是OCR识别算法。4.如权利要求1所述的基于深度学习的字体识别方法,其特征在于,所述步骤S120中,包括:S121、将每个所述文本图像区域通过目标检测算法进行单个字符的识别;S122、获得每个所述文本图像区域中代表单个文字的文字图像区域和所述文字图像区域在所述输入图片中的平面坐标框。5.如权利要求4所述的基于深度学习的字体识别方法,其特征在于,所述目标检测算法是YOLO识别算法。6.如权利要求1所述的基于深度学习的字体识别方法,其特征在于,所述步骤S140中,包括:S141、将所述单个字符的对应的文字图像区...

【专利技术属性】
技术研发人员:王嘉欣陈辰赵华鞠剑勋李健
申请(专利权)人:上海携旅信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1