【技术实现步骤摘要】
一种字体识别方法、装置和存储介质
本公开涉及但不限于一种计算机图像处理、人工智能等技术,尤其涉及一种字体识别方法、装置和存储介质。
技术介绍
目前字体识别的技术方案主要有两种:机器学习和图像处理。机器学习主要是通过搜集大量不同字体样本,不断训练迭代优化模型的方法,达到字体识别的目的,因为字体种类很多,如果要使模型识别的泛化能力更强,必须提供大量不同种类的样本数据。而图像处理方法是通过分析计算字体图片本身的特征,进行特征匹配的方法达到识别的目的;这种方法不需要事先准备大量不同字体样本数据,但需要根据需求提供待识别字体库明细。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本公开实施例提供一种字体识别方法、装置和存储介质,不依赖于大量各类字体的样本,提升了字体识别的准确性和执行效率。本公开实施例提供一种字体识别方法,包括,根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;对于每一个待进行字体识别的文本区域图片分别进行如下操作:根据所述文本区域图片和预设的字体库,生成至少一个字体图片;根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。一些示例性的实施例中,所述根据所述文本区域图片和预 ...
【技术保护点】
1.一种字体识别方法,其特征在于,包括,/n根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;/n对于每一个待进行字体识别的文本区域图片分别进行如下操作:/n根据所述文本区域图片和预设的字体库,生成至少一个字体图片;/n根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;/n分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;/n选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。/n
【技术特征摘要】
1.一种字体识别方法,其特征在于,包括,
根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;
对于每一个待进行字体识别的文本区域图片分别进行如下操作:
根据所述文本区域图片和预设的字体库,生成至少一个字体图片;
根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;
分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;
选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述文本区域图片和预设的字体库,生成至少一个字体图片,包括:
根据所述文本区域图片进行光学字符识别OCR,确定文本内容;
根据所述文本区域图片的宽度和高度,确定字号;
根据所述文本区域图片的宽度、高度和所述字号,按照所述预设的字体库中的字体列表,针对所述文本内容生成至少一个字体图片;其中,每一个字体图片分别是所述文本内容采用一种字体时的图片。
3.根据权利要求1所述的方法,其特征在于,
所述根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片,包括:
对所述文本图片进行文本区域检测,根据检测结果将所述文本图片划分为至少一个文本区域图片;
对所述至少一个文本区域图片进行过滤,将过滤后保留下来的文本区域图片各自确定为一个待进行字体识别的文本区域图片;
其中,所述对所述至少一个文本区域图片进行过滤包括:
对所述至少一个文本区域图片进行颜色种类过滤;
或者,对所述至少一个文本区域图片进行高度过滤;
或者,对所述至少一个文本区域图片进行颜色种类过滤和高度过滤。
4.根据权利要求3所述的方法,其特征在于,
对所述至少一个文本区域图片进行颜色种类过滤,包括:
分别确定每一个文本区域图片所包含的颜色种类的数量;
过滤掉文本区域图片所包含的颜色种类的数量小于预设的种类下限数,或大于预设的种类上限数的文本区域图片。
5.根据权利要求3所述的方法,其特征在于,
对所述至少一个文本区域图片进行高度过滤,包括:
计算全部文本区域图片的高度;根据计算得到的高度按照降序对全部文本区域图片进行排序;
在排序后的前H个文本区域图片中,根据预设的保留条件,选...
【专利技术属性】
技术研发人员:陈景伟,
申请(专利权)人:北京百炼智能科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。