文本识别网络模型的训练方法及装置、设备、存储介质制造方法及图纸

技术编号:37716438 阅读:8 留言:0更新日期:2023-06-02 00:12
本申请实施例公开了一种文本识别网络模型的训练方法及装置、设备、存储介质,包括:在所述特征提取网络的搜索空间中,随机调整所述特征提取网络的网络结构;基于训练样本训练调整后的神经网络模型直至收敛;其中,所述调整后的神经网络模型包括调整所述网络结构后的特征提取网络;对于预设搜索次数中的每一次,在所述搜索空间中随机调整所述特征提取网络的网络结构,得到子网络;在测试样本上确定所述子网络的准确性;基于所述预设搜索次数中每一次神经网络模型的准确性,确定所述文本识别网络。通过上述方法,有利于通过该文本识别网络结构实现准确且快速的文本识别。络结构实现准确且快速的文本识别。络结构实现准确且快速的文本识别。

【技术实现步骤摘要】
文本识别网络模型的训练方法及装置、设备、存储介质


[0001]本申请涉及电子设备
,涉及但不限定于文本识别网络模型的训练方法及装置、设备、存储介质。

技术介绍

[0002]现有技术中,文本识别需要通过人工手动设定神经网络的网络结构参数来实现,包括:将待识别的图像输入到改进型卷积循环神经网络CRNN模型中,以使得所述改进型CRNN模型对所述待识别图像中的文本进行识别;获得文本识别结果;其中,所述改进型CRNN模型包括卷积神经网络CNN模块、循环神经网络RNN模块和CTC模块,所述CNN模块、所述RNN模块和所述CTC模块依次连接,所述CNN模块为八度卷积OctConv结构;输出所述文本识别结果。可以看出,上述方法通过人工手动方式设定神经网络的网络结构参数,存在网络性能和预测准确率不高的问题。

技术实现思路

[0003]本申请实施例提供一种文本识别网络模型的训练方法及装置、设备、存储介质。
[0004]本申请实施例的技术方案是这样实现的:
[0005]第一方面,本申请实施例提供一种文本识别网络模型的训练方法,所述方法包括:在所述特征提取网络的搜索空间中,随机调整所述特征提取网络的网络结构;基于训练样本训练调整后的神经网络模型直至收敛;其中,所述调整后的神经网络模型包括调整所述网络结构后的特征提取网络;对于预设搜索次数中的每一次,在所述搜索空间中随机调整所述特征提取网络的网络结构,得到子网络;在测试样本上确定所述子网络的准确性;基于所述预设搜索次数中每一次神经网络模型的准确性,确定所述文本识别网络。
[0006]第二方面,本申请实施例提供一种文本识别网络模型的训练装置,所述装置包括:第一调整模块,用于在所述特征提取网络的搜索空间中,随机调整所述特征提取网络的网络结构;基于训练样本训练调整后的神经网络模型直至收敛;其中,所述调整后的神经网络模型包括调整所述网络结构后的特征提取网络;第二调整模块,用于对于预设搜索次数中的每一次,在所述搜索空间中随机调整所述特征提取网络的网络结构,得到子网络;在测试样本上确定所述子网络的准确性;第一确定模块,用于基于所述预设搜索次数中每一次神经网络模型的准确性,确定所述文本识别网络。
[0007]第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述文本识别网络模型的训练方法中的步骤。
[0008]第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述文本识别网络模型的训练方法中的步骤。
[0009]本申请实施例提供的技术方案带来的有益效果至少包括:
[0010]在本申请实施例中,通过对于预设搜索次数中的每一次,在所述搜索空间中随机
调整所述特征提取网络的网络结构,能够实现采用神经结构搜索技术的方法搜索出准确性且效率较高的文本识别网络结构,有利于通过该文本识别网络结构实现准确且快速的文本识别。
附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
[0012]图1A为本申请实施例提供的文本识别网络模型的训练方法的一种网络架构示意图;
[0013]图1B为本申请实施例提供的一种文本识别网络模型的训练方法的流程示意图;
[0014]图2为本申请实施例提供的一种文本识别网络模型的训练方法的流程示意图;
[0015]图3为本申请实施例提供的一种文本识别网络模型的训练方法的流程示意图;
[0016]图4本申请实施例提供的一种文本识别的方法的流程示意图;
[0017]图5A为本申请实施例提供的一种确定训练样本的流程示意图;
[0018]图5B为本申请实施例提供的一种调整样本序列顺序的场景示意图;
[0019]图5C为本申请实施例提供的一种调整样本序列顺序的场景示意图;
[0020]图5D为本申请实施例提供的一种调整样本序列顺序的场景示意图;
[0021]图6A为本申请实施例提供的一种共享参数的流程示意图;
[0022]图6B为本申请实施例提供的一种确定卷积核的场景示意图;
[0023]图6C为本申请实施例提供的一种确定卷积核的场景示意图;
[0024]图7为本申请实施例提供的一种文本识别网络模型的训练装置的组成结构示意图;
[0025]图8为本申请实施例提供的一种电子设备的硬件实体示意图。
具体实施方式
[0026]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。以下实施例用于说明本申请,但不用来限制本申请的范围。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0027]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0028]需要指出,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
[0029]本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请实施例所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
[0030]相关技术中,文本识别需要通过人工手动设定神经网络的网络结构参数来实现。示例性的,一种文本识别方法包括:
[0031]将待识别的图像输入到改进型卷积循环神经网络CRNN模型中,以使得所述改进型CRNN模型对所述待识别图像中的文本进行识别;获得文本识别结果;其中,所述改进型CRNN模型包括卷积神经网络CNN模块、循环神经网络RNN模块和CTC模块,所述CNN模块、所述RNN模块和所述CTC模块依次连接,所述CNN模块为八度卷积OctConv结构;输出所述文本识别结果。
[0032]示例性的,又一种文本识别方法包括:使用进化算法和代理任务来找到最佳训练方法。通过搜索得到的最优的图像颜色类型,真实数据比例,训练字符集等参数,在搜索得到的所述参数的基础上,采用二阶段训练方式:通过使用辅助解本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别网络模型的训练方法,其特征在于,待训练的神经网络模型包括特征提取网络,所述方法包括:在所述特征提取网络的搜索空间中,随机调整所述特征提取网络的网络结构;基于训练样本训练调整后的神经网络模型直至收敛;其中,所述调整后的神经网络模型包括调整所述网络结构后的特征提取网络;对于预设搜索次数中的每一次,在所述搜索空间中随机调整所述特征提取网络的网络结构,得到子网络;在测试样本上确定所述子网络的准确性;基于所述预设搜索次数中每一次神经网络模型的准确性,确定所述文本识别网络。2.权利要求1所述的方法,其特征在于,所述在所述特征提取网络的搜索空间中,随机调整所述特征提取网络的网络结构,包括:从所述搜索空间中均匀随机确定一初始网络结构;利用所述初始网络结构初始化所述特征提取网络;对应地,所述基于训练样本训练调整后的神经网络模型直至收敛,包括:利用所述训练样本对所述特征提取网络进行训练,以调整所述特征提取网络的模型参数;根据所述模型参数,确定训练过程中的误差;在所述误差收敛的情况下,确定所述神经网络模型收敛。3.权利要求1所述的方法,其特征在于,所述特征提取网络至少包括一个卷积核,所述搜索空间包括通道数时,所述在所述特征提取网络的搜索空间中,随机调整所述特征提取网络的网络结构,包括:获取所述通道数对应的倍率搜索范围和基础通道数;基于所述基础通道数和所述倍率搜索范围,确定最大通道数;根据所述最大通道数创建初始卷积核;基于所述基础通道数和所述倍率搜索范围,确定目标通道数;当所述目标通道数小于或等于所述最大通道数时,所述目标通道数对应的卷积核共享所述初始卷积核的参数。4.权利要求1所述的方法,其特征在于,所述特征提取网络至少包括一个卷积层,每一所述卷积层中至少包括一个卷积核,所述搜索空间包括下采样步长时,每一所述下采样步长对应一个卷积核,所述在所述特征提取网络的搜索空间中,随机调整所述特征提取网络的网络结构,包括:获取所述下采样步长对应的步长搜索范围;从所述步长搜索范围内确定目标下采样步长;将所述目标下采样步长对应的卷积核作为所述卷积层中的目标卷积核,并关闭所述卷积层中除所述目标卷积核之外的其他卷积核。5.权利要求1所述的方法,其特征在于,所述搜索空间包括卷积核的尺寸时,所述在所述特征提取网络的搜索空间中,随机调整所述特征提取网络的网络结构,包括:获取所述卷积核的尺寸对应的尺寸搜索范围;从所述尺寸搜索范围内确定目标尺寸;从所述尺寸搜索范围内确定最大尺寸,得到待调整卷积核;
将所述待调整的卷积核中心确定为所述目标尺寸的卷积核中心;变换所述待调整卷积核的形状,得到变换后的卷积核,以共享待调整卷积核的部分参...

【专利技术属性】
技术研发人员:周华健
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1