一种图文文字转换识别系统及方法技术方案

技术编号:38860645 阅读:26 留言:0更新日期:2023-09-17 10:03
本发明专利技术涉及一种图文文字转换识别系统及方法,尤其涉及图文识别技术领域,包括,图像获取模块,用以获取文字图像;特征提取模块,用以对文字图像进行特征提取,以得到图像特征向量;提取调整模块,用以根据文字线宽对文字图像的特征提取过程进行调整;特征分析模块,用以根据图像特征向量对文字图像进行识别;判断模块,用以根据识别文字的数量对文字操作方式进行判断;输出模块,用以对识别文字进行输出;调整优化模块,根据识别文字数量对文字线宽的计算过程进行优化,还用以根据识别文字数量对文字图像特征提取过程进行调整。本发明专利技术实现了对文字图像中文字的识别,解决了图文转换别效率低,识别文字的准确率低的问题。识别文字的准确率低的问题。识别文字的准确率低的问题。

【技术实现步骤摘要】
一种图文文字转换识别系统及方法


[0001]本专利技术涉及图文识别
,尤其涉及一种图文文字转换识别系统及方法。

技术介绍

[0002]光学文字识别技术是目前常用的一种进行图文转换的技术,可通过对图像的转化、分析和识别操作将图像中的文字信息识别输出,提高了人们的办公效率,使得提高光学文字识别技术的识别效率和准确性成为了目前的关键课题。
[0003]中国专利公开号:CN102982330B公开了一种文字图像中字符识别方法和识别装置,包括对文字图像中切割出的字符,以设定单位进行划分;对所述设定单位内的每个字符进行特征提取和特征匹配后,确定每个字符的候选字;针对所述设定单位内的每个字符,确定该字符的每个候选字的相似度、以及该字符的每个候选字与该字符相邻的字符的候选字之间的转移概率;根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果。该专利技术实现了对图文识别中各字符的匹配分析,在对各字符的相似度分析时,对字符的结构匹配精度低,存在对图文转换识别效率低,识别文字的准确率低的问题。

技术实现思路

[0004]为此,本专利技术提供一种图文文字转换识别系统及方法,用以克服现有技术中图文转换识别效率低,识别文字的准确率低的问题。
[0005]为实现上述目的,本专利技术提供一种图文文字转换识别系统,包括:图像获取模块,用以获取文字图像;特征提取模块,用以对文字图像进行特征提取,以得到图像特征向量;提取调整模块,用以根据文字图像对文字线宽进行分析,并根据文字线宽对文字图像的特征提取过程进行调整;特征分析模块,用以根据图像特征向量对文字图像进行识别,以得到识别文字;判断模块,用以根据识别文字的数量对文字操作方式进行判断;输出模块,用以在文字操作方式为输出操作时,对识别文字进行输出;调整优化模块,用以在文字操作方式为优化操作时,根据识别文字数量对文字线宽的计算过程进行优化,所述调整优化模块还用以根据识别文字数量对文字图像特征提取过程进行调整;所述特征提取模块包括:图像处理单元,用以根据文字图像灰度对文字图像进行二化值处理,以得到黑白图像;图像旋转单元,用以对黑白图像进行旋转处理,以得到旋转图像;图像分区单元,用以对黑白图像进行分区处理,以得到多个黑白图像区域,用以对旋转图像进行分区处理,以得到多个旋转图像区域;特征提取单元,用以对各黑白图像区域进行特征提取,以得到标准特征向量,还用
以对各旋转图像区域进行特征提取,以得到旋转特征向量;所述特征分析模块包括:特征分析单元,用以计算标准特征向量与旋转特征向量的相似度,并根据相似度对文字图像对应的字符集进行判断;文字识别单元,用以根据标准特征向量和文字图像对应的字符集对文字图像进行识别,以得到识别文字。
[0006]进一步地,所述图像处理单元以文字图像中心点为坐标原点,平行于文字图像上下边界的轴为x轴,平行于文字图像左右边界的轴为y轴,建立平面直角坐标系,x轴从左向右依次增大,y轴从下向上依次增大,用坐标表示文字图像中的每一个像素点;所述图像处理单元将文字图像的各像素点灰度与灰度阈值进行比对,并根据比对结果对文字图像像素点灰度进行修改,其中:当G(x,y)≤g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G'(x,y),设定G'(x,y)=0;当G(x,y)>g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G"(x,y),设定G"(x,y)=255;其中,G(x,y)表示文字图像像素点灰度,g表示灰度阈值,其取值范围为0<g<255。
[0007]进一步地,所述特征提取单元根据黑白图像区域和旋转图像区域的像素点灰度值对黑白图像区域和旋转图像区域进行特征提取,将黑白图像区域和旋转图像区域的像素点灰度值与样本平均灰度进行作差,得到灰度变化量,所述特征提取单元将黑白图像区域内像素点的灰度变化量作为标准特征向量,将旋转图像区域内像素点的灰度变化量作为旋转特征向量,所述特征提取单元设有灰度变化量计算公式如下:b(x,y)=G(x,y)

G1(x,y)G1(x,y)=[G(x

i,y+i)+G(x

i+1,y+i)+...+G(x+i,y

i)]/(2
×
i+1)2其中,b(x,y)表示灰度变化量,G1(x,y)表示样本平均灰度,i表示样本参数,其取值范围为i={2≤i≤6,i∈N
+
}。
[0008]进一步地,所述提取调整模块根据文字图像灰度通过线宽计算公式计算文字线宽,所述提取调整模块设有线宽计算公式如下:D=G0/(2
×
y
max
)其中,D表示文字线宽,D向下取整,G0表示文字图像中灰度为0的像素点数量;所述提取调整模块根据文字线宽对样本平均灰度进行调整,调整后的样本平均灰度为G1'(x,y),设定G1'(x,y)=G1(x,y)
×
i/D。
[0009]进一步地,所述特征分析单元通过相似度计算公式分别计算标准特征向量与第一旋转特征向量和第二旋转特征向量的相似度,得到第一相似度和第二相似度,所述特征分析单元设有相似度计算公式如下:Qj=B01/Bj1×
B01×
Bj2×
B02/Bj2×
B02×
Bj3×
..
×
B0
k
/Bj
k
×
B0
k
×
Bj
k+1
其中,Qj表示相似度,Bj表示旋转特征向量,j表示旋转特征向量编号,其取值范围为:j={1,2},B0表示标准特征向量,k表示区域编号,其取值范围为:k={1,2,3,4|当k=4时,k+1=1}。
[0010]进一步地,所述特征分析单元分别将第一相似度和第二相似度与相似度阈值进行比对,并根据比对结果对文字图像对应的字符集进行判断,其中:当Q1≥α且Q2≥α时,所述特征分析单元判定文字图像对应的字符集为第一字符集;当Q1<α且Q2≥α时,所述特征分析单元判定文字图像对应的字符集为第二字符集;当Q1<α且Q2<α时,所述特征分析单元判定文字图像对应的字符集为第三字符集;其中,α表示相似度阈值,其取值范围为0.5<α<1。
[0011]进一步地,所述文字识别单元计算标准特征向量与文字图像对应的字符集中的字符特征向量的比值,将比值与识别阈值进行比对,并根据比对结果对识别文字进行判断,其中:当B0/M(n)≥β时,所述文字识别单元判定字符集中当前文字为识别文字;当B0/M(n)<β时,所述文字识别单元判定字符集中当前文字非识别文字;其中M(n)表示字符集中文字的字符特征向量,n表示字符集中的文字,β表示识别阈值,其取值范围为0.8≤β<1。
[0012]进一步地,所述判断模块根据识别文字数量对文字操作方式进行判断,其中:当S≤1时,所述判断模块判定文字操作方式为输出操作;当S>1时,所述判断模块判定文字本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图文文字转换识别系统,其特征在于,包括:图像获取模块,用以获取文字图像;特征提取模块,用以对文字图像进行特征提取,以得到图像特征向量;提取调整模块,用以根据文字图像对文字线宽进行分析,并根据文字线宽对文字图像的特征提取过程进行调整;特征分析模块,用以根据图像特征向量对文字图像进行识别,以得到识别文字;判断模块,用以根据识别文字的数量对文字操作方式进行判断;输出模块,用以在文字操作方式为输出操作时,对识别文字进行输出;调整优化模块,用以在文字操作方式为优化操作时,根据识别文字数量对文字线宽的计算过程进行优化,所述调整优化模块还用以根据识别文字数量对文字图像特征提取过程进行调整;所述特征提取模块包括:图像处理单元,用以根据文字图像灰度对文字图像进行二化值处理,以得到黑白图像;图像旋转单元,用以对黑白图像进行旋转处理,以得到旋转图像;图像分区单元,用以对黑白图像进行分区处理,以得到多个黑白图像区域,用以对旋转图像进行分区处理,以得到多个旋转图像区域;特征提取单元,用以对各黑白图像区域进行特征提取,以得到标准特征向量,还用以对各旋转图像区域进行特征提取,以得到旋转特征向量;所述特征分析模块包括:特征分析单元,用以计算标准特征向量与旋转特征向量的相似度,并根据相似度对文字图像对应的字符集进行判断;文字识别单元,用以根据标准特征向量和文字图像对应的字符集对文字图像进行识别,以得到识别文字。2.根据权利要求1所述的图文文字转换识别系统,其特征在于,包括,所述图像处理单元以文字图像中心点为坐标原点,平行于文字图像上下边界的轴为x轴,平行于文字图像左右边界的轴为y轴,建立平面直角坐标系,x轴从左向右依次增大,y轴从下向上依次增大,用坐标表示文字图像中的每一个像素点;所述图像处理单元将文字图像的各像素点灰度与灰度阈值进行比对,并根据比对结果对文字图像像素点灰度进行修改,其中:当G(x,y)≤g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G'(x,y),设定G'(x,y)=0;当G(x,y)>g时,所述图像处理单元对文字图像像素点灰度进行修改,修改后的文字图像像素点灰度为G"(x,y),设定G"(x,y)=255;其中,G(x,y)表示文字图像像素点灰度,g表示灰度阈值,其取值范围为0<g<255。3.根据权利要求1所述的图文文字转换识别系统,其特征在于,包括,所述特征提取单元根据黑白图像区域和旋转图像区域的像素点灰度值对黑白图像区域和旋转图像区域进行特征提取,将黑白图像区域和旋转图像区域的像素点灰度值与样本平均灰度进行作差,得到灰度变化量,所述特征提取单元将黑白图像区域内像素点的灰度变化量作为标准特征向量,将旋转图像区域内像素点的灰度变化量作为旋转特征向量,所述特征提取单元设有
灰度变化量计算公式如下:b(x,y)=G(x,y)

G1(x,y)G1(x,y)=[G(x

i,y+i)+G(x

i+1,y+i)+...+G(x+i,y

i)]/(2
×
i+1)2其中,b(x,y)表示灰度变化量,G1(x,y)表示样本平均灰度,i表示样本参数,其取值范围为i={2≤i≤6,i∈N
+
}。4.根据权利要求1所述的图文文字转换识别系统,其特征在于,包括,所述提取调整模块根据文字图像灰度通过线宽计算公式计算文字线宽,所述提取调整模块设有线宽计算公式如下:D=G0/(2
×
y
max
)所述提取调整模块根据文字线宽对样本平均灰度进行调整,调整后的样本平均灰度为G1'(x,y),设定G1'...

【专利技术属性】
技术研发人员:邱发科钱秋雷姜金龙高跃岭李明旭王义同
申请(专利权)人:山东唐和智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1