一种字体识别方法、装置和存储介质制造方法及图纸

技术编号:28422273 阅读:27 留言:0更新日期:2021-05-11 18:30
本文公开了一种字体识别方法、装置和存储介质。其中,所述方法包括,根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;对于每一个待进行字体识别的文本区域图片分别进行如下操作:根据所述文本区域图片和预设的字体库,生成至少一个字体图片;根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。

【技术实现步骤摘要】
一种字体识别方法、装置和存储介质
本公开涉及但不限于一种计算机图像处理、人工智能等技术,尤其涉及一种字体识别方法、装置和存储介质。
技术介绍
目前字体识别的技术方案主要有两种:机器学习和图像处理。机器学习主要是通过搜集大量不同字体样本,不断训练迭代优化模型的方法,达到字体识别的目的,因为字体种类很多,如果要使模型识别的泛化能力更强,必须提供大量不同种类的样本数据。而图像处理方法是通过分析计算字体图片本身的特征,进行特征匹配的方法达到识别的目的;这种方法不需要事先准备大量不同字体样本数据,但需要根据需求提供待识别字体库明细。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本公开实施例提供一种字体识别方法、装置和存储介质,不依赖于大量各类字体的样本,提升了字体识别的准确性和执行效率。本公开实施例提供一种字体识别方法,包括,根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;对于每一个待进行字体识别的文本区域图片分别进行如下操作:根据所述文本区域图片和预设的字体库,生成至少一个字体图片;根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。一些示例性的实施例中,所述根据所述文本区域图片和预设的字体库,生成至少一个字体图片,包括:根据所述文本区域图片进行光学字符识别OCR,确定文本内容;根据所述文本区域图片的宽度和高度,确定字号;根据所述文本区域图片的宽度、高度和所述字号,按照所述预设的字体库中的字体列表,针对所述文本内容生成至少一个字体图片;其中,每一个字体图片分别是所述文本内容采用一种字体时的图片。一些示例性的实施例中,所述根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片,包括:对所述文本图片进行文本区域检测,根据检测结果将所述文本图片划分为至少一个文本区域图片;对所述至少一个文本区域图片进行过滤,将过滤后保留下来的文本区域图片各自确定为一个待进行字体识别的文本区域图片;其中,所述对所述至少一个文本区域图片进行过滤包括:对所述至少一个文本区域图片进行颜色种类过滤;或者,对所述至少一个文本区域图片进行高度过滤;或者,对所述至少一个文本区域图片进行颜色种类过滤和高度过滤。一些示例性的实施例中,对所述至少一个文本区域图片进行颜色种类过滤,包括:分别确定每一个文本区域图片所包含的颜色种类的数量;过滤掉文本区域图片所包含的颜色种类的数量小于预设的种类下限数,或大于预设的种类上限数的文本区域图片。一些示例性的实施例中,对所述至少一个文本区域图片进行高度过滤,包括:计算全部文本区域图片的高度;根据计算得到的高度按照降序对全部文本区域图片进行排序;在排序后的前H个文本区域图片中,根据预设的保留条件,选择符合所述保留条件的文本区域图片为被保留的文本区域图片;过滤掉其他未被选择的文本区域图片;其中,H为大于1的整数;所述保留条件为:文本区域图片的高度大于第一高度,且该文本区域图片的高度与所述待识别的文本图片的高度的比例大于第一高度比例。一些示例性的实施例中,所述预设的特征提取算法包括:尺度不变特征转换sift特征提取算法;所述根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点,包括:根据所述sift特征提取算法,提取所述文本区域图片的sift特征;根据所述sift特征提取算法,提取每一个字体图片的sift特征;所述分别进行所述文本区域图片和每一个字体图片特征点匹配,包括:对于每一个字体图片,分别执行如下步骤:采用最小临近距离法,对所述文本区域图片对应的sift特征和该字体图片对应的sift特征进行特征点匹配。一些示例性的实施例中,所述确定对应的特征相似度,包括:对于每一个字体图片,分别执行如下步骤:对根据所述文本区域图片对应的sift特征和该字体图片对应的sift特征进行特征点匹配所得到的特征点对,至少进行以下过滤操作之一:临近距离过滤和主方向过滤;将过滤前的特征点对的数量和过滤后的特征点对的数量的比值,确定为所述文本图片与该字体图片的相似度。一些示例性的实施例中,进行临近距离过滤,包括:分别计算所述文本区域图片的每一个sift特征点匹配得到的特征点对中的最小距离和次小距离,当所述最小距离与所述次小距离的比值大于预设比例阈值时,从匹配结果中删除该sift特征点匹配得到了全部特征点对;进行主方向过滤,包括:分别计算每一个特征点对中特征点的主方向差值;过滤掉主方向差值大于预设的差值阈值的特征点对。本公开实施例还提供一种电子装置,包括存储器和处理器,所述存储器中存储有用于进行字体识别的计算机程序,所述处理器被设置为读取并运行所述用于进行字体识别的计算机程序以执行上述任一种字体识别的方法。本公开实施例还提供一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一种字体识别的方法。可以看到,本公开实施例提供的方案克服了现有字体识别方案的技术局限性,能够对待测图片中目标字体进行快速识别,并显著提高了识别准确率。在阅读并理解了附图和详细描述后,可以明白其他方面。附图说明图1为本公开一实施例中一种字体识别方法的流程图;图2为本公开一实施例中craft文本检测方案的网络结构示意图;图3为本公开一实施例中craft文本检测方案的流程图;图4为本公开一实施例中OCR识别的网络结构示意图;图5为本公开一实施例中文字的字体图片生成流程图;图6为本公开一实施例中计算图片包含的颜色种类数量的流程图;图7为本公开一实施例中进行图片高度过滤的流程图;图8为本公开一实施例中进行文本区域图片二值化的流程图;图9为本公开一实施例中进行特征点匹配的流程图;图10为本公开一实施例中进行相似度计算的流程图;图11为本公开另一实施例中字体识别方法的流程图;图12(a)-(f)为本公开实例一中字体识别方法相关步骤的处理图片示意图;图13为本公开另一实施例中一种字体识别方法的流程图;图14为本公开另一实施例中一种字体识别装置的结构图。具体实施方式为使本公开的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本专利技术作进一步的详细描述。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。随着计算机互联网多媒体技术的快速发展,为了更本文档来自技高网...

【技术保护点】
1.一种字体识别方法,其特征在于,包括,/n根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;/n对于每一个待进行字体识别的文本区域图片分别进行如下操作:/n根据所述文本区域图片和预设的字体库,生成至少一个字体图片;/n根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;/n分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;/n选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。/n

【技术特征摘要】
1.一种字体识别方法,其特征在于,包括,
根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;
对于每一个待进行字体识别的文本区域图片分别进行如下操作:
根据所述文本区域图片和预设的字体库,生成至少一个字体图片;
根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;
分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;
选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。


2.根据权利要求1所述的方法,其特征在于,
所述根据所述文本区域图片和预设的字体库,生成至少一个字体图片,包括:
根据所述文本区域图片进行光学字符识别OCR,确定文本内容;
根据所述文本区域图片的宽度和高度,确定字号;
根据所述文本区域图片的宽度、高度和所述字号,按照所述预设的字体库中的字体列表,针对所述文本内容生成至少一个字体图片;其中,每一个字体图片分别是所述文本内容采用一种字体时的图片。


3.根据权利要求1所述的方法,其特征在于,
所述根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片,包括:
对所述文本图片进行文本区域检测,根据检测结果将所述文本图片划分为至少一个文本区域图片;
对所述至少一个文本区域图片进行过滤,将过滤后保留下来的文本区域图片各自确定为一个待进行字体识别的文本区域图片;
其中,所述对所述至少一个文本区域图片进行过滤包括:
对所述至少一个文本区域图片进行颜色种类过滤;
或者,对所述至少一个文本区域图片进行高度过滤;
或者,对所述至少一个文本区域图片进行颜色种类过滤和高度过滤。


4.根据权利要求3所述的方法,其特征在于,
对所述至少一个文本区域图片进行颜色种类过滤,包括:
分别确定每一个文本区域图片所包含的颜色种类的数量;
过滤掉文本区域图片所包含的颜色种类的数量小于预设的种类下限数,或大于预设的种类上限数的文本区域图片。


5.根据权利要求3所述的方法,其特征在于,
对所述至少一个文本区域图片进行高度过滤,包括:
计算全部文本区域图片的高度;根据计算得到的高度按照降序对全部文本区域图片进行排序;
在排序后的前H个文本区域图片中,根据预设的保留条件,选...

【专利技术属性】
技术研发人员:陈景伟
申请(专利权)人:北京百炼智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1