一种文字识别方法、识别模型训练方法和相关装置制造方法及图纸

技术编号：40796999 阅读：4 留言：0更新日期：2024-03-28 19:24

本申请公开了一种文字识别方法、识别模型训练方法和相关装置，该方法包括：获取待识别样本；将所述待识别样本输入至训练后的识别模型中的卷积模块，得到所述待识别样本对应的不同识别轮次的分类特征；将所述分类特征输入至所述识别模型中的分类模块，得到所述待识别样本对应的目标文本；其中，所述分类模块包括第一分类层和第二分类层，所述第一分类层对应有至少一个第一候选字符，所述第一候选字符包括占位符，所述第二分类层对应有多个区别于所述第一候选字符的第二候选字符。通过上述方式，本申请能够提高文字识别的效率和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及文字识别，特别是涉及一种文字识别方法、识别模型训练方法和相关装置。

技术介绍

1、随着信息化和智能化的不断发展，文字识别成为信息收集的重要方式。目前的文字识别方法主要是利用不同结构的神经网络模型进行识别实现。为提高模型的识别效率，可以采用模型压缩等方式简化模型的结构，以达到减少计算量和提高识别效率的目的。但是，传统的模型压缩方法对模型原有结构具备一定的要求，导致模型无法学习不同特征之间的非线性关系。有鉴于此，如何提出一种识别准确性以及识别效率较高的文字识别方法，成为亟待解决的问题。

技术实现思路

1、本申请主要解决的技术问题是提供一种文字识别方法、识别模型训练方法和相关装置，能够提高文字识别的效率和准确性。

2、为解决上述技术问题，本申请采用的一个技术方案是：提供一种文字识别方法，包括：获取待识别样本；将所述待识别样本输入至训练后的识别模型中的卷积模块，得到所述待识别样本对应的不同识别轮次的分类特征；将所述分类特征输入至所述识别模型中的分类模块，得到所述待识别样本对应的目标文本；其中，所述分类模块包括第一分类层和第二分类层，所述第一分类层对应有至少一个第一候选字符，所述第一候选字符包括占位符，所述第二分类层对应有多个区别于所述第一候选字符的第二候选字符。

3、为解决上述技术问题，本申请采用的一个技术方案是：提供一种识别模型的训练方法，包括：获取多个训练样本对包含多个卷积支路的初始模型进行训练，得到训练后的所述初始模型；其中，每个所述卷积支路包括非线

4、为解决上述技术问题，本申请采用的另一个技术方案是：提供一种文字识别系统，包括：获取网络，用于获取待识别样本；卷积网络，用于将所述待识别样本输入至训练后的识别模型中的卷积模块，得到所述待识别样本对应的不同识别轮次的分类特征；分类网络，用于将所述分类特征输入至所述识别模型中的分类模块，得到所述待识别样本对应的目标文本；其中，所述分类模块包括第一分类层和第二分类层，所述第一分类层对应有至少一个第一候选字符，所述第一候选字符包括占位符，所述第二分类层对应有多个区别于所述第一候选字符的第二候选字符。

5、为解决上述技术问题，本申请采用的另一个技术方案是：提供一种电子设备，包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现如上述技术方案中提到的方法。

6、为解决上述技术问题，本申请采用的另一个技术方案是：提供一种计算机可读存储介质，其上存储有程序指令，所述程序指令被处理器执行时实现如上述技术方案中提到的方法。

7、本申请的有益效果是：区别于现有技术的情况，本申请提出的文字识别方法，在获取到不同识别轮次的分类特征后，利用第一分类层和第二分类层对分类特征进行分步解码。其中，上述第一分类层中包括的第一参考字符为常用字符，通过优先利用第一分类层对分类特征进行解码，以节省文字识别所消耗的计算资源，从而有助于提高整体识别效率。

本文档来自技高网...

【技术保护点】

1.一种文字识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述分类特征输入至所述识别模型中的分类模块，得到所述待识别样本对应的目标文本，包括：

3.根据权利要求2所述的方法，其特征在于，所述将当前识别轮次对应的所述分类特征输入至所述第一分类层，得到当前识别轮次对应的第一识别结果，包括：

4.根据权利要求2所述的方法，其特征在于，所述将当前识别轮次的所述分类特征和所述第一识别结果输入至所述第二分类层，得到当前识别轮次对应的第二识别结果，包括：

5.根据权利要求3或4所述的方法，其特征在于，获取当前识别轮次对应的所述目标字符之后，还包括：

6.一种识别模型的训练方法，其特征在于，包括：

7.根据权利要求6所述的方法，其特征在于，所述初始模型中每个所述卷积支路包括归一化层，所述归一化层与所述非线性层连接，所述非线性层的所述表达函数的确定过程，包括：

8.一种文字识别系统，其特征在于，包括：

9.一种电子设备，其特征在于，包括：相互耦接的存储器和处理器，所述存储

10.一种计算机可读存储介质，其上存储有程序指令，其特征在于，所述程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种文字识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述分类特征输入至所述识别模型中的分类模块，得到所述待识别样本对应的目标文本，包括：

5.根据权利要求3或4所述的方法，其特征在于，获取当前识别轮次对应的所述目标字符之后，还...

【专利技术属性】
技术研发人员：周鹏，殷保才，陈明军，谢名亮，杨争艳，殷兵，胡金水，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人