一种汉字识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39438132 阅读:10 留言:0更新日期:2023-11-19 16:21
本发明专利技术实施例涉及人工智能技术领域,特别涉及一种汉字识别方法、装置、计算机设备和存储介质。方法包括:获取待识别汉字图像;将待识别汉字图像送入到预设的图像分割模型中,获取待识别汉字图像中文字区域的特征向量组;根据预设规则,将所述特征向量组中的非零元素转化为0或1,得到新的特征向量组;根据所述新的特征向量组中各特征向量,从所述汉字信息库中各汉字对应的编码中,确定出与所述特征向量相似度最高的目标编码;将所述目标编码对应的汉字确定为目标汉字。本方案提高了汉字识别的效率。此外,还可以达到节省存储空间的目的。还可以达到节省存储空间的目的。还可以达到节省存储空间的目的。

【技术实现步骤摘要】
一种汉字识别方法、装置、计算机设备和存储介质


[0001]本专利技术实施例涉及人工智能
,特别涉及一种汉字识别方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着深度学习技术的快速发展,在汉字识别领域也广泛采用了深度学习方法。汉字是一种由笔画组成的文字、且笔画复杂多样、所以汉字识别相对于英文字母组成的图像识别要更困难。随着汉字图像识别的能力在办公自动化过程中显得日益重要,企业非常迫切地需要针对手写体汉字识别精度高、速度快的算法。
[0003]现阶段,主流的汉字识别模型是检测+识别,其中检测解决的是哪里有汉字,汉字的范围有多大。识别是对定位好的汉字区域进行识别,主要解决的是每个汉字是什么,将图像中的汉字区域转化为字符信息。现有的检测+识别模型的优点是程序计算速度快、耗时低,缺点是汉字图像内容解析的完整性不能保证。

技术实现思路

[0004]针对现有技术的以上缺陷或改进需求,本专利技术实施例提供了一种汉字识别方法、装置、计算机设备和存储介质,以改善上述问题。为实现上述目的,本专利技术采取的技术方案如下:
[0005]第一方面,本专利技术实施例提供了一种汉字识别方法,所述方法包括:
[0006]设置汉字识别的汉字类别数,构建包含所有汉字的汉字信息库,对所述汉字信息库中各汉字进行汉字编码;
[0007]获取待识别汉字图像,然后将待识别汉字图像送入到预设的图像分割模型中,获得汉字内容区域,对所述汉字内容区域求连通区域,获得单一汉字内容区域,获取所述单一汉字内容区域的特征向量组,其中,所述特征向量组中各特征向量的维度和汉字信息库中汉字编码的长度相等,所述特征向量的各元素为上述编码中的每一位处的概率值;根据预设规则,将所述特征向量组中的非零元素转化为0或1,得到新的特征向量组;根据所述新的特征向量组中各特征向量,从所述汉字信息库中各汉字对应的编码中,确定出与所述特征向量相似度最高的目标编码,将所述目标编码对应的汉字确定为目标汉字。
[0008]第二方面,本专利技术实施例提供一种汉字识别装置,包括:获取单元,用于获取待识别的汉字图像;提取单元,将所述待识别汉字图像送入到预设的图像分割模型中,获得汉字内容区域,对所述汉字内容区域求连通区域,获得单一汉字内容区域,提取所述单一汉字内容区域的特征向量组,其中,所述特征向量组中各特征向量的维度和汉字信息库中汉字编码的长度相等,所述特征向量的各元素为上述编码中的每一位处的概率值;确定单元,用于针对所述提取单元提取出的每个所述特征向量组,根据预设规则,将所述特征向量组中的非零元素转化为0或1,得到新的特征向量组,根据所述新的特征向量组中各特征向量,从所述汉字信息库中各汉字对应的编码中,确定出与所述特征向量相似度最高的目标编码;识
别单元,用于将所述确定单元确定出的所述目标编码对应的汉字确定为汉字识别结果。
[0009]第三方面,本专利技术实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本说明书任一实施例所的方法;
[0010]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书任一实施例所述的方法。
[0011]在本专利技术实施例提供了一种汉字识别方法、装置、计算机设备及存储介质,在上述技术方案中,获取到待识别汉字图像后,首先获取上述待识别汉字图像中文字区域的特征向量组;接下来,针对上述特征向量组中的各特征向量,从汉字信息库中各汉字对应的编码中,确定出与该特征向量相似度最高的目标编码;然后,将该目标编码对应的汉字确定为汉字识别结果。由于汉字信息库中对所有汉字的编码长度远远小于该汉字信息库中的汉字总数,这样,各特征向量的维度相对较低。这样,可以减少确定特征向量组时的计算工作量,并使得目标编码的获取更加快捷,从而提高了汉字识别的效率。此外,还可以达到节省存储空间的目的。
附图说明
[0012]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]图1是本专利技术实施例提供的一种的汉字识别方法流程图;
[0014]图2是本专利技术实施例提供的Unet图像分割网络模型的示意图;
[0015]图3是本专利技术实施例提供的一种获取预设图像分割网络模型的方法的流程图;
[0016]图4是本专利技术实施例提供的一种汉字图像的识别装置结构图;
[0017]图5是本专利技术实施例提供的一种模型训练装置的结构图;
[0018]图6是本专利技术实施例提供的一种电子设备的硬件架构图。
具体实施方式
[0019]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0020]本专利技术实施例提供了一种汉字识别方法,可以解决汉字图像识别的问题,包含如图1所示的以下实现步骤:
[0021]步骤100:获取待识别汉字图像;
[0022]需要说明的是,本步骤中的待识别的汉字图像可以是通过联机的摄像设备采集,也可以是已保存的场景图像,具体可以根据实际应用场景而定,在此不做具体限定。
[0023]步骤101:将待识别汉字图像送入到预设的图像分割模型中,获得汉字内容区域,对所述汉字内容区域求连通区域,获得单一汉字内容区域,获取所述单一汉字内容区域的
特征向量组。
[0024]在本实施例中,举例来说,待识别汉字图像的尺寸为W*H(W为图像宽度,H为图像高度),且通道数为3,首先将该待识别汉字图像输入到预设的图像分割模型中,图像分割模型如图2所示,模型输出该待识别汉字图像对应的W*H*C的特征张量,其中C为通道数,通道数与汉字编码的长度相等,对每个通道上的文字区域求连通区域,对于相邻两个通道上的连通区域如果重叠部分大于预设的阈值,则合并两个连通区域,连通区域计算方法采用四邻域连通区域计算,最终对于所有文字区域位置都能得到一个一维的特征向量,得到的特征向量维度为(C,1),每个连通区域上的特征向量组成一个特征向量组;
[0025]另外,上述预设的图像分割模型可以为本专利技术中所用的Unet图像分割模型,也可以是其它图像分割模型,对此,在本专利技术中不作具体限定。另外,可以通过图3中所示的步骤301~步骤303来获取该预设的图像分割网络模型。
[0026]在步骤301中,获取多个训练样本图像。
[0027]在本专利技术实施例中,可以通过多种方式来获取该训练样本图像。在一种实施方式中,可以通过人工标记获取,即通过拍摄等方式获取到多个训练样本图像,对每个训练样本图像中包括的字符进行人工标记。然而,由于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种汉字识别方法,其特征在于,包括:设置汉字识别的汉字类别数,构建包含所有汉字的汉字信息库,对所述汉字信息库中各汉字进行汉字编码;获取待识别汉字图像,然后将待识别汉字图像送入到预设的图像分割模型中,获得汉字内容区域,对所述汉字内容区域求连通区域,获得单一汉字内容区域,获取所述单一汉字内容区域的特征向量组,其中,所述特征向量组中各特征向量的维度和汉字信息库中汉字编码的长度相等,所述特征向量的各元素为上述编码中的每一位处的概率值;根据预设规则,将所述特征向量组中的非零元素转化为0或1,得到新的特征向量组,根据所述新的特征向量组中各特征向量,从所述汉字信息库中各汉字对应的编码中,确定出与所述特征向量相似度最高的目标编码,将所述目标编码对应的汉字确定为目标汉字。2.根据权利要求1所述的方法,其特征在于,所述获取所述单一汉字内容区域的特征向量组,包括:将所述待识别汉字图像输入到预设图像分割网络模型中,得汉字内容区域,对所述汉字内容区域求连通区域,获得单一汉字内容区域,获取所述单一汉字内容区域的特征向量组,其中,所述预设图像分割网络模型根据所述汉字信息库中各汉字对应的编码构建。3.根据权利要求2所述的方法,其特征在于,所述预设图像分割网络模型通过以下步骤来构建,包括:获取多个训练样本图像;将所述多个训练样本图像输入到初始图像分割网络模型中,得到所述初始图像分割网络模型的输出结果,其中,所述图像分割网络模型中至少一层卷积层的卷积核数量根据所述编码的长度确定,编码的长度等于所述特征向量的维度,并且特征向量的各元素与上述编码中的每一位一一对应;根据所述输出结果和标记数据的比对结果,对所述初始图像分割网络模型进行训练,得到预设图像分割网络模型,其中,所述标记数据为与所述多个训练样本图像分别对应的识别正确的特征向量组。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述汉字信息库中各汉字对应的编码通过以下方式来确定:针对所述汉字信息库中的每个汉字,获取汉字信息库中各汉字对应的汉字字体图像,将所述汉字字体图像二值化处理,直接将二值化后的汉字字体图像展开,得到汉字信息库中所有汉字的汉字编码;针对所述汉字信息库中的每个汉字,采用one_hot编码对每个汉字进行编码,编码长度为汉字信息库中所有汉字字符类别总数;针对...

【专利技术属性】
技术研发人员:王婷婷邵允学
申请(专利权)人:南京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1