一种文字细化方法及装置制造方法及图纸

技术编号:39830487 阅读:6 留言:0更新日期:2023-12-29 16:11
本发明专利技术涉及计算机视觉技术领域,特别涉及一种文字细化方法及装置

【技术实现步骤摘要】
一种文字细化方法及装置


[0001]本专利技术涉及计算机视觉
,特别涉及一种文字细化方法及装置


技术介绍

[0002]随着计算机视觉领域的发展,文字识别在图像处理

模式识别

车辆检测等领域得到广泛应用,而文字细化作为文字识别的重要手段,它将提取文字中的关键特征信息作为文字图像前期处理的重要依据

文字细化也称为文字骨架化,是保证文字图像原有几何拓扑结构不变的情况基于某种规则对文字边缘像素迭代删除直至获得单像素文字线条的处理过程,但现有成熟的文字细化算法,如
ZS
细化算法
、Hilditch
细化算法
、Pavlidis
细化算法等算法存在细化后文字骨架存在噪声点

细化后文字出现像素冗余

像素缺失或毛刺较多的现象,导致细化结果识别率较低,将影响文字识别的后续分析

因此,在保证文字原始几何拓扑结构的情况下,降低文字细化后出现毛刺或冗余像素的概率以及保证文字细化精度将成为文字识别领域研究的热点问题

[0003]为提高文字细化后的精度,国内外学者提出很多文字细化算法,基于概率理论对文字进行迭代细化可得到较精确的细化中心线,但算法无法保证文字原始拓扑结构且算法复杂度较高;采用改进的
Pavlidis
细化算法来获取更精确的细化文字,但细化结果毛刺较多,不易于识别;基于
CNN
卷积神经网络构造文字细化模型来获取文字骨架线,但算法复杂度较高;对
Hilditch
细化算法进行改进消除原有算法的弊端,但细化后的文字仍存在冗余像素,细化精度较低

上述算法可一定程度获取文字骨架中心线,细化精度有所改善,但仍存在一定误差

[0004]现有技术都是从整体角度对文字进行细化来获取细化后的文字骨架,其细化结果仍存在较大偏差


技术实现思路

[0005]针对上述问题,本专利技术提供一种文字细化方法及装置

[0006]第一方面,本专利技术提供了一种文字细化方法,所述方法包括:
[0007]基于边缘检测提取文字边缘线;
[0008]基于文字边缘线和文字笔画分解方式按照笔画顺序进行拆分,得到文字的各个笔画边缘线;
[0009]基于笔画边缘线得到笔画中心线;
[0010]将笔画中心线进行合并,得到细化后的文字

[0011]进一步的,基于边缘检测提取文字边缘线,包括:
[0012]采用各向同性
Sobel
算子提取文字边缘线;
[0013]将对各向同性
Sobel
算子进行改进,在原有水平算子和垂直算子基础上增加
45
°

135
°
两个方向的检测算子

[0014]进一步的,基于笔画边缘线得到笔画中心线,包括:
[0015]基于距离变换算法对拆分后的每个笔画提取中心线点;
[0016]对每个笔画的中心线点拟合,得到细化后的笔画中心线

[0017]进一步的,基于距离变换算法对拆分后的每个笔画提取中心线点,包括:
[0018]采用马氏距离替代欧式距离确定每个笔画的中心线点

[0019]进一步的,对每个笔画的中心线点拟合,包括:
[0020]采用改进加权最小二乘法对笔画中心线点进行拟合,具体如下:
[0021]将对角矩阵
M
对角元素逆序排列获得新对角矩阵
M
x
,使用新对角矩阵
M
x
对笔画进行拟合,即改进加权最小二乘法公式如下:
[0022][0023]式中:
C
表示
m
×
n
维测量矩阵,
V
表示
m
×1维向量;
[0024]对角矩阵
M
对角线元素为权重的倒数,均为常数

[0025]进一步的,基于笔画边缘线得到笔画中心线,包括:
[0026]将笔画中心线进行合并,得到细化后的文字,包括:
[0027]将得到的每个笔画的中心线按笔画顺序依次逆序压入栈中,根据结构比例关系,将栈中的笔画中心线按出栈顺序进行合并,得到细化后的文字

[0028]第二方面,本专利技术提供了一种文字识别方法,采用上述的文字细化方法,对文字进行处理

[0029]第三方面,本专利技术提供了一种文字细化装置,包括:文字边缘线提取单元

笔画边缘线识别单元

笔画中心线识别单元和合并单元;
[0030]文字边缘线提取单元,用于基于边缘检测提取文字边缘线;
[0031]笔画边缘线识别单元,用于基于文字边缘线和文字笔画分解方式按照笔画顺序进行拆分,得到文字的各个笔画边缘线;
[0032]笔画中心线识别单元,用于基于笔画边缘线得到笔画中心线;
[0033]合并单元,用于将笔画中心线进行合并,得到细化后的文字

[0034]第四方面,本专利技术提供了一种电子设备,包括处理器

通信接口

存储器和通信总线,其中,处理器

通信接口和存储器通过通信总线完成相互间的通信;
[0035]存储器,存储有计算机程序;
[0036]处理器,用于执行存储器上所存储的计算机程序时,实现上述的文字细化方法

[0037]第五方面,本专利技术提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的文字细化方法

[0038]本专利技术至少具备以下有益效果:
[0039]本专利技术对于不同分辨率的文字细化结果具有更强的鲁棒性,进一步消除毛刺和冗余像素的影响;一定程度提高细化效率;在编码效率有所改善的情况下,细化精度更高

本专利技术提出算法在相对误差较小的情况下,文字细化结果精度更高

[0040]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解

本专利技术的目的和其他优点可通过在说明书以及附图中所指出的结构来实现和获得

附图说明
[0041]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0042]图1为本专利技术实施例细化方法流程图;
[0043]图2为本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种文字细化方法,其特征在于,所述方法包括:基于边缘检测提取文字边缘线;基于文字边缘线和文字笔画分解方式按照笔画顺序进行拆分,得到文字的各个笔画边缘线;基于笔画边缘线得到笔画中心线;将笔画中心线进行合并,得到细化后的文字
。2.
根据权利要求1所述的文字细化方法,其特征在于,基于边缘检测提取文字边缘线,包括:采用各向同性
Sobel
算子提取文字边缘线;将对各向同性
Sobel
算子进行改进,在原有水平算子和垂直算子基础上增加
45
°

135
°
两个方向的检测算子
。3.
根据权利要求1所述的文字细化方法,其特征在于,基于笔画边缘线得到笔画中心线,包括:基于距离变换算法对拆分后的每个笔画提取中心线点;对每个笔画的中心线点拟合,得到细化后的笔画中心线
。4.
根据权利要求3所述的文字细化方法,其特征在于,基于距离变换算法对拆分后的每个笔画提取中心线点,包括:采用马氏距离替代欧式距离确定每个笔画的中心线点
。5.
根据权利要求3所述的文字细化方法,其特征在于,对每个笔画的中心线点拟合,包括:采用改进加权最小二乘法对笔画中心线点进行拟合,具体如下:将对角矩阵
M
对角元素逆序排列获得新对角矩阵
M
x
,使用新对角矩阵
M
x
对笔画进行拟合,即改进加权最小二乘法公式如下:式中:
C
表示
m
×
n
维测量矩阵,
V

【专利技术属性】
技术研发人员:刘言冬付颖
申请(专利权)人:国家电投集团黄河上游水电开发有限责任公司青海黄河上游水电开发有限责任公司拉西瓦发电分公司西宁南川绿电配售电有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1