一种基于端到端的通信大数据行程卡识别方法技术

技术编号：39805075 阅读：6 留言：0更新日期：2023-12-22 02:38

本发明专利技术涉及人工智能光学字符识别技术领域，具体而言，涉及一种基于端到端的通信大数据行程卡识别方法，该方法的步骤包括：依据文本框的尺寸信息对文本框进行调节矫正，使文本框尺寸满足调节所需的角度以及比例；通过预设的神经网络对矫正后的文本框进行分离特征提取，得出字体的特征数据，通过

全部详细技术资料下载

【技术实现步骤摘要】
一种基于端到端的通信大数据行程卡识别方法

[0001]本专利技术涉及一种基于端到端的通信大数据行程卡识别方法
。

技术介绍

[0002]近年来，深度学习在文字识别上取得了巨大进步，性能已远远超于传统识别方法，对于文本框中文字的识别，常用的算法有
CRNN、CRNN+CTC
等，但是，对于大数据量下的文字识别，应考虑文字识别速度，且深度卷积神经网络很难直接处理文本识别的序列问题；并且现有算法在大数据量的情况下，识别速度有待提升；同时受拍摄行为的影响，图片可能模糊，受光照的影响，使得图片反光，以至于不能准确提取到相应文字，影响算法结果的准确性
。
针对上述问题，我们提供了一种基于端到端的通信大数据行程卡识别方法
。

技术实现思路

[0003]本专利技术的目的在于提供一种基于端到端的通信大数据行程卡识别方法，其将深度神经网络的分离网络及残差网络进行有效整合，可以更快更准的识别出文本框中的文字，在文字识别过程中，本方案采用的
Bi
‑
GRU
相比于传统
Bi
‑
LSTM
识别方式，在性能一致的情况下，参数更少，因此训练及预测速度更快，且与使用
softmax
进行参数优化的方式相比，本专利技术利用不需要对齐的
CTC
对
Bi
‑
GRU
进行网络参数优化，使得优化更为合理，文字识别效果更好
。
[0004]本专利技...

【技术保护点】

【技术特征摘要】
1.
一种基于端到端的通信大数据行程卡识别方法，其特征在于，该方法的步骤包括：从图片中检测出文本框，并将文本框进行角度矫正；通过预训练的识别模型对矫正后的文本框进行文字识别，输出识别出的文字内容；所述识别模型包括深度卷积神经网络和
Bi
‑
GRU
循环神经网络，深度卷积神经网络为包括有分离卷积块和残差块的
DCNN
结构，所述深度卷积神经网络用于提取出文本框的特征数据，所述
Bi
‑
GRU
循环神经网络获取特征数据所对应的文字内容
。2.
根据权利要求1所述的基于端到端的通信大数据行程卡识别方法，其特征在于，所述提取文本框的特征数据的具体步骤如下所示：所述分离卷积块中各通道采用不同的卷积核对矫正后的文本进行特征提取，并对所述各通道卷积后的结果进行拼接，并作池化处理；采用残差块对分离卷积块的输入进行卷积操作，并将残差块的输出与池化处理后的结果相加，作为下一次分离卷积块的输入；当无残差块进行卷积操作时，将最后一个输出转换成一维向量处理，并采用全链接层卷积提取特征作为文本框的特征数据
。3.
根据权利要求2所述的基于端到端的通信大数据行程卡识别方法，其特征在于，其中，所述分离卷积中单通道的卷积核具体为3乘
1、1
乘3或者3乘
3、1
乘
1。4.
根据权利要求1所述的基于端到端的通信大数据行程卡识别方法，其特征在于，所述
Bi
‑
GRU
循环神经网络具体如下式所示：
y
t
＝
σ
...

【专利技术属性】
技术研发人员：廖海峰，董博，林洪湖，马杲灵，
申请(专利权)人：云上数联贵州信息技术有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人