一种字符识别方法、装置、设备、介质及产品制造方法及图纸

技术编号：32274121 阅读：23 留言：0更新日期：2022-02-12 19:39

本申请提供了一种字符识别方法、装置、设备及介质，该方法包括：电子设备获取待识别的图像，通过包括编码器和解码器的字符识别模型对该图像进行识别，获的识别结果序列。其中解码器的损失函数包括自回归解码损失函数和生成对抗损失函数，生成对抗损失函数根据判别器获得，判别器用于在字符识别模型的训练中对于输出结果进行判别，以提高字符识别模型的识别精度，并且避免训练数据的暴露。并且避免训练数据的暴露。并且避免训练数据的暴露。

全部详细技术资料下载

【技术实现步骤摘要】
一种字符识别方法、装置、设备、介质及产品

[0001]本申请涉及人工智能(artificial intelligence，AI)
，尤其涉及一种字符识别方法、装置、设备以及计算机可读存储介质、计算机程序产品。

技术介绍

[0002]目前，很多业务场景中需要对图像中的文字信息等进行识别。例如，网上银行服务常常需要对用户上传的证件图像、票据图像等进行字符识别，以实现相关信息录入。业界通常采用光学字符识别(optical character recognition，OCR)对图像中的文字信息等进行识别。
[0003]OCR是指对图像进行分析识别，获得文字信息的过程。OCR通常包括文本检测和文本识别。文本检测是指检测图像中的文字区域，文本识别是指对文字区域进行识别，得到文字信息。
[0004]由于深度学习在很多任务取得较大的进展，越来越多的研究人员将深度学习引入文本识别。基于深度学习的文本识别主要分为以卷积循环神经网络(convolutional recurrent neural network，CRNN)为代...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法，其特征在于，所述方法包括：获取待识别的图像；通过字符识别模型对所述图像进行识别，获得识别结果序列；其中，所述字符识别模型包括编码器和解码器，所述解码器的损失函数包括自回归解码损失函数和生成对抗损失函数；利用判别器对所述识别结果序列进行判别，当判别通过时，输出所述识别结果序列。2.根据权利要求1所述的方法，其特征在于，所述字符识别模型通过如下方式训练得到：将训练数据输入所述字符识别模型，获得所述训练数据中训练图像的识别结果序列；将所述识别结果序列和所述训练数据中标签序列的编码特征以及所述字符识别模型中编码器的编码特征输入判别器，获得判别结果；根据所述识别结果序列、所述标签序列和所述自回归解码损失函数，确定自回归解码损失值，根据所述识别结果序列、所述判别结果和所述生成对抗损失函数，确定生成对抗损失值；根据所述自回归解码损失值和所述生成对抗损失值更新所述字符识别模型的参数。3.根据权利要求2所述的方法，其特征在于，所述解码器以字符为单位进行解码，所述判别器以句子为单位进行判别。4.根据权利要求1至3任一项所述的方法，其特征在于，所述生成对抗损失函数为交叉熵损失函数。5.一种字符识别装置，其特征在于，所述装置包括：通信模块，用于获取待识别的图像；识别模块，用于通过字符识别模型对所述图像进行识别，获得识别结果序列；其中，所述字符识别模型包括编码器和解码器，所述解码器的损失函数包括自回归解码损失函数和生成对抗...

【专利技术属性】
技术研发人员：范湉湉，黄灿，王长虎，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人