一种图片字体识别方法、系统、电子设备及存储介质技术方案

技术编号:36404569 阅读:60 留言:0更新日期:2023-01-18 10:12
本发明专利技术涉及一种图片字体识别方法、系统、电子设备及存储介质,涉及文字识别领域,该方法包括:对待识别图片进行预处理,获得文字轮廓图像;增强文字轮廓图像的饱和度和对比度,获得文字轮廓增强图像;将文字轮廓增强图像进行区域划分,划分为设定数量的区域;获取文字轮廓增强图像中各区域的特征值;将文字轮廓增强图像的特征值与字模库中各文字的特征值进行相似度匹配,获得多个匹配值,将最高匹配值对应的字模库中文字信息输出,文字信息包括字形和字体类型;字模库中每条信息包括字形、字体类型和各区域的特征值;文字轮廓增强图像的特征值包括文字轮廓增强图像各区域的特征值。本发明专利技术提高了图片中文字识别的准确性。本发明专利技术提高了图片中文字识别的准确性。本发明专利技术提高了图片中文字识别的准确性。

【技术实现步骤摘要】
一种图片字体识别方法、系统、电子设备及存储介质


[0001]本专利技术涉及文字识别
,特别是涉及一种图片字体识别方法、系统、电子设备及存储介质。

技术介绍

[0002]随着科技发展趋于智能化数字化,提取图片文字需求日益增多。人们对可视化操作越发依赖,对于图像文字识别技术而言,识别技术逐渐成熟。光学字符识别(Optical Character Recognition,OCR)就是图像文字识别技术中的一种。然而,大多数人的字体识别能力是非常有限的,因为目前的常用文字(如中文、英文)字体繁多,可能高达数千种,且某些字体类别之间的差异微乎其微,即使是专业人士,也需要长时间的记忆训练才能具备一定的字体识别能力,而且能分辨的字体类别也是有限的,因此,基于图片的字体识别技术在文档图像处理和艺术设计领域一直是一项重要的技术,尤其相较设计行业而言,方便快捷的转化识别图片上的字体并且输出相应内容的字体格式显得尤为重要,尤其人们对知识产权更加重视,字体版权相关信息,也是需要考虑的因素。

技术实现思路

[0003]本专利技术的目的是提供一种图片字体识别方法、系统、电子设备及存储介质,提高了图片中文字识别的准确性和全面性。
[0004]为实现上述目的,本专利技术提供了如下方案:一种图片字体识别方法,包括:对待识别图片进行预处理,获得文字轮廓图像;增强所述文字轮廓图像的饱和度和对比度,获得文字轮廓增强图像;将所述文字轮廓增强图像进行区域划分,划分为设定数量的区域;获取所述文字轮廓增强图像中各区域的特征值;将所述文字轮廓增强图像的特征值与字模库中各文字的特征值进行相似度匹配,获得多个匹配值,将最高匹配值对应的所述字模库中文字信息输出,所述文字信息包括字形和字体类型;所述字模库中每条信息包括字形、字体类型和各区域的特征值;所述文字轮廓增强图像的特征值包括所述文字轮廓增强图像各区域的特征值,所述字模库中各文字的特征值包括各文字对应的各区域的特征值。
[0005]可选地,所述将所述文字轮廓增强图像进行区域划分,划分为设定数量的区域,具体包括:按照九宫格形式将所述文字轮廓增强图像划分为9个区域。
[0006]可选地,所述字模库的构建过程包括:获取各种开源字体文字;将各开源字体文字进行区域划分,划分为设定数量的区域;获取各开源字体文字对应的各区域的特征值;
将各开源字体文字的字形、字体类型和各区域的特征值存储所述字模库;一个开源文字对应一条存储信息。
[0007]可选地,所述对待识别图片进行预处理,获得文字轮廓图像,具体包括:对所述待识别图片进行背景阈值化处理,获得文字轮廓图像。
[0008]可选地,所述字体包括黑体、宋体和楷体。
[0009]本专利技术公开了一种图片字体识别系统,包括:文字轮廓图像获取模块,用于对待识别图片进行预处理,获得文字轮廓图像;文字轮廓图像增强模块,用于增强所述文字轮廓图像的饱和度和对比度,获得文字轮廓增强图像;区域划分模块,用于将所述文字轮廓增强图像进行区域划分,划分为设定数量的区域;特征值获取模块,用于获取所述文字轮廓增强图像中各区域的特征值;特征值匹配模块,用于将所述文字轮廓增强图像的特征值与字模库中各文字的特征值进行相似度匹配,获得多个匹配值,将最高匹配值对应的所述字模库中文字信息输出,所述文字信息包括字形和字体类型;所述字模库中每条信息包括字形、字体类型和各区域的特征值;所述文字轮廓增强图像的特征值包括所述文字轮廓增强图像各区域的特征值,所述字模库中各文字的特征值包括各文字对应的各区域的特征值。
[0010]本专利技术还公开了一种电子设备,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行所述的图片字体识别方法。
[0011]本专利技术还公开了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现所述的图片字体识别方法。
[0012]根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术获得待识别图片中文字各区域的特征值,将各特征值与字模库中对应的各特征值进行相似度匹配,将相似度最高的的匹配值对应的字模库中文字信息输出,其中特征值包括字形和与字形对应的字体类型,从而提高了图片中文字识别的准确性和全面性。
附图说明
[0013]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1为本专利技术一种图片字体识别方法流程示意图;图2为本专利技术文字轮廓增强图像区域划分示意图;图3为本专利技术一种图片字体识别系统结构示意图。
具体实施方式
[0015]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于
本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0016]本专利技术的目的是提供一种图片字体识别方法、系统、电子设备及存储介质,提高了图片中文字识别的准确性。
[0017]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0018]实施例1图1为本专利技术一种图片字体识别方法流程示意图,如图1所示,一种图片字体识别方法,包括:步骤101:对待识别图片进行预处理,获得文字轮廓图像。
[0019]一个文字对应一个文字轮廓图像。
[0020]提取的文字轮廓图像必须保证其文字笔画与矩形图片边缘相切,以确保每个区域中文字部分的占比达到最大,提高准确性。
[0021]其中,步骤101具体包括:对所述待识别图片进行背景阈值化处理,即对待识别图片的背景进行过滤,对文字进行定位分割,通过文字间距空白处进行定位,将待识别图片分割成一个个单独的文字,获得每个文字的文字轮廓图像。
[0022]步骤102:增强所述文字轮廓图像的饱和度和对比度,获得文字轮廓增强图像。
[0023]本专利技术对文字轮廓图像的增强用以更精确的提取出文字内容。
[0024]步骤103:将所述文字轮廓增强图像进行区域划分,划分为设定数量的区域。
[0025]其中,步骤103具体包括:按照九宫格形式将所述文字轮廓增强图像划分为9个区域。
[0026]“字”字划分为9个区域如图2所示。
[0027]步骤104:获取所述文字轮廓增强图像中各区域的特征值。
[0028]各区域的特征值为各区域文字轮廓的坐标组成的特征向量。
[0029]分割的每块区域中的特征,以相量坐标的形式将区域中的文字轮廓的边界进行定位,即字体轮廓在分割的不同区域里均可以采集几个边界处的定位点相量坐标值,如单独分割区域中的最左、最右、最上和最下坐本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图片字体识别方法,其特征在于,包括:对待识别图片进行预处理,获得文字轮廓图像;增强所述文字轮廓图像的饱和度和对比度,获得文字轮廓增强图像;将所述文字轮廓增强图像进行区域划分,划分为设定数量的区域;获取所述文字轮廓增强图像中各区域的特征值;将所述文字轮廓增强图像的特征值与字模库中各文字的特征值进行相似度匹配,获得多个匹配值,将最高匹配值对应的所述字模库中文字信息输出,所述文字信息包括字形和字体类型;所述字模库中每条信息包括字形、字体类型和各区域的特征值;所述文字轮廓增强图像的特征值包括所述文字轮廓增强图像各区域的特征值,所述字模库中各文字的特征值包括各文字对应的各区域的特征值。2.根据权利要求1所述的图片字体识别方法,其特征在于,所述将所述文字轮廓增强图像进行区域划分,划分为设定数量的区域,具体包括:按照九宫格形式将所述文字轮廓增强图像划分为9个区域。3.根据权利要求1所述的图片字体识别方法,其特征在于,所述字模库的构建过程包括:获取各种开源字体文字;将各开源字体文字进行区域划分,划分为设定数量的区域;获取各开源字体文字对应的各区域的特征值;将各开源字体文字的字形、字体类型和各区域的特征值存储所述字模库;一个开源文字对应一条存储信息。4.根据权利要求1所述的图片字体识别方法,其特征在于,所述对待识别图片进行预处理,获得文字轮廓图像,具体包括:对所述待...

【专利技术属性】
技术研发人员:牟文青王晓菲杨西帅姜远鹏吴忠洋王冰
申请(专利权)人:山东捷瑞数字科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1