基于双通道的文本识别方法、装置、设备及存储介质制造方法及图纸

技术编号:38470838 阅读:32 留言:0更新日期:2023-08-11 14:47
本申请提供一种基于双通道的文本识别方法、装置、设备及存储介质,涉及机器学习技术领域。该方法包括:获取双通道模型的长短期记忆网络通道输出的第一字符串,以及双通道模型的变换通道输出的第二字符串;获取差异字符的占比;若差异字符的占比小于预设阈值,则逐一对比第一字符得分和对应的第二字符得分,将字符得分高的字符作为第三字符;输出多个第三字符组成的第三字符串。本申请的方法,根据字符得分互补长短期记忆网络通道输出的第一字符串和变换通道输出的第二字符串,确定字符得分更高的第三字符串,提高了识别文本的准确率。提高了识别文本的准确率。提高了识别文本的准确率。

【技术实现步骤摘要】
基于双通道的文本识别方法、装置、设备及存储介质


[0001]本申请涉及机器学习技术,尤其涉及一种基于双通道的文本识别方法、装置、设备及存储介质。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR),是指通过电子设备(例如扫描仪或者数码相机)获取载体(例如纸张或者屏幕)上的文本,再采用文本识别方法识别文本的过程。
[0003]主流的文本识别方法为基于卷积神经网络(Convolutional Neural Networks,CNN)的长短期记忆网络(Long Short

Term Memory,LSTM),即卷积递归神经网络(Convolution Recurrent Neural Network,CRNN)。CRNN的优点为可以直接使用序列标签学习,不受序列长度约束,包含参数少,以及内存要求小等;CRNN的缺点为算法效果一般,泛化能力较差,以及对于生僻字、形近字、标点符号等识别不准确等。
[0004]另一种文本识别方法为基于变换(Transformer)的文本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于双通道的文本识别方法,其特征在于,所述方法,包括:获取双通道模型的长短期记忆网络通道输出的第一字符串,以及所述双通道模型的变换通道输出的第二字符串,所述第一字符串包括多个第一字符,以及每个第一字符对应的第一字符得分,所述第二字符串包括多个第二字符,以及每个第二字符对应的第二字符得分,所述字符得分用于指示字符的准确率;获取差异字符的占比,所述差异字符是根据所述第一字符串和所述第二字符串中相同位置的字符是否相同确定的;若所述差异字符的占比小于预设阈值,则逐一对比所述第一字符得分和对应的所述第二字符得分,将字符得分高的字符作为第三字符;输出多个第三字符组成的第三字符串。2.根据权利要求1所述的方法,其特征在于,所述获取差异字符的占比,包括:获取差异字符;根据所述第一字符串和所述第二字符串,确定总字符数量;根据所述总字符数量和所述差异字符的字符数量,确定所述差异字符的占比。3.根据权利要求2所述的方法,其特征在于,所述获取差异字符,包括:若所述第一字符串中的第一目标字符与所述第二字符串中的第二目标字符不同,则将所述第一目标字符和所述第二目标字符作为差异字符,所述第一目标字符和所述第二目标字符在各自的字符串中位置相同。4.根据权利要求1

3任一项所述的方法,其特征在于,所述获取差异字符的占比之前,还包括:若所述第一字符的数量与所述第二字符的数量不同,则根据所述第一字符串和所述第二字符串,确定缺失字符的位置,所述缺失字符是根据所述第一字符的位置和相应的所述第二字符的位置是否相同确定的;将所述缺失字符的位置对应的字符设置为空字符,并将所述空字符对应的字符得分设置为零。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若所述差异字符的占比不小于所述预设阈值,则根据多个第一字符得分和多个第二字符得分,确定第一字符串的第一字符平均得分,以及第二字符串的第二字符平均得分;根据所述第一字符平均得分和所述第二字符平均得分,确定第三字符串,所述第三字符串为所述第一字符串和第二字符串中字符平均得分高的字符串。6.根据权利要求1所述的方法,其特征在于,所述获取双通道模型的长短期记忆网络通道输出的第一字符串,以及所述双通道模型的变换通道输出的第二字符串,包括:...

【专利技术属性】
技术研发人员:李研何非蒋维厉智孙玉刚刘梦雅
申请(专利权)人:联通数字科技有限公司联通物联网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1