金融票据识别方法、装置及电子设备、存储介质制造方法及图纸

技术编号：40951066 阅读：2 留言：0更新日期：2024-04-18 20:26

本申请公开了一种金融票据识别方法、装置及电子设备、存储介质，其中所述方法包括获取包含金融票据的待处理图像；通过预先训练的图像识别模型，识别出所述待处理图像中金融票据的文字信息，所述图像识别模型用于处理存在图像失真的手工书写金融票据和/或电子输入金融票据。通过本申请提高了OCR识别金融票据过程中的鲁棒性。本申请可用于金融领域中OCR识别。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像处理，尤其涉及一种金融票据识别方法、装置及电子设备、存储介质。

技术介绍

1、光学字符识别技术(optical character recognition，ocr)已经被广泛应用于各行各业中。

2、目前采用ocr技术在识别金融票据的时候会有以下两点问题:

3、(1)现在互联网十分发达，许多金融票据的图像可能在网上经过传播，在传播的过程中会出现图像失真的问题(例如，jpeg压缩，高斯噪声等)，ocr技术在识别这些图像的时候精度会降低。

4、(2)金融票据具有多样性(电子票据，手写票据)，ocr技术尤其是在识别手写金融票据的时候检测精度会大幅度降低。

技术实现思路

1、本申请实施例提供了一种金融票据识别方法、装置及电子设备、存储介质，以提高金融票据orc识别的准确率。

2、本申请实施例采用下述技术方案：

3、第一方面，本申请实施例提供一种金融票据识别方法，其中，所述方法包括：

4、获取包含金融票据的待处理图像；

5、通过预先训练的图像识别模型，识别出所述待处理图像中金融票据的文字信息，所述图像识别模型用于处理存在图像失真的手工书写金融票据和/或电子输入金融票据。

6、在一些实施例中，所述通过预先训练的图像识别模型，识别出所述待处理图像中金融票据的文字信息，包括：

7、通过预先训练的图像识别模型，将所述待处理图像中的浅层细节特征和深层语义特征进行融合；

9、通过联系上下文识别所述手工书写金融票据和/或电子输入金融票据中的目标关注区域中的文字，得到去除存在图像失真的待处理图像的识别结果。

10、在一些实施例中，所述图像识别模型为使用多组数据将卷积神经网络训练至收敛后得到的，多组数据中的每组数据均包括：经过图像增强处理的图像样本数据，所述图像增强处理至少包括如下之一：图像压缩、高斯噪声、图像旋转。

11、在一些实施例中，所述图像识别模型包括cnn卷积神经网络特征提取模块，所述cnn卷积神经网络特征提取模块包括：

12、mlfa多层特征聚合模块，用以提取出来的不同语义层次的特征；

13、cbam卷积块注意力机制模块，用以将将通道注意力和空间注意力顺序的组合在一起，以对所述mlfa多层特征聚合模块聚合好的特征进行优化。

14、在一些实施例中，所述图像识别模型还包括：lstm长短期记忆模块，用以

15、接收所述cnn卷积神经网络特征提取模块的特征，并进行预测特征序列的标签，以得到长文本识别时可能丢失上文信息。

16、在一些实施例中，所述图像识别模型还包括：ctc神经网络的时序分类模块，用以

17、基于blank字符，对所述lstm长短期记忆模块输出的文本信息中的字符进行对齐。

18、在一些实施例中，所述获取包含金融票据的待处理图像之后，包括：对所述待处理图像进行倾斜校正、图像去噪、二值化中的任意一种或多种处理。

19、第二方面，本申请实施例还提供一种金融票据识别装置，其中，所述装置包括：

20、获取模块，用于获取包含金融票据的待处理图像；

21、识别模块，用于通过预先训练的图像识别模型，识别出所述待处理图像中金融票据的文字信息，所述图像识别模型用于处理存在图像失真的手工书写金融票据和/或电子输入金融票据。

22、第三方面，本申请实施例还提供一种电子设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行上述方法。

23、第四方面，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行上述方法。

24、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：获取包含金融票据的待处理图像，再通过预先训练的图像识别模型，识别出所述待处理图像中金融票据的文字信息。由于所述图像识别模型用于处理存在图像失真的手工书写金融票据和/或电子输入金融票据，从而提高ocr识别金融票据时的鲁棒性。

本文档来自技高网...

【技术保护点】

1.一种金融票据识别方法，其中，所述方法包括：

2.如权利要求1所述方法，其中，所述通过预先训练的图像识别模型，识别出所述待处理图像中金融票据的文字信息，包括：

3.如权利要求2所述方法，其中，所述图像识别模型为使用多组数据将卷积神经网络训练至收敛后得到的，多组数据中的每组数据均包括：经过图像增强处理的图像样本数据，所述图像增强处理至少包括如下之一：图像压缩、高斯噪声、图像旋转。

4.如权利要求1所述方法，其中，所述图像识别模型包括CNN卷积神经网络特征提取模块，所述CNN卷积神经网络特征提取模块包括：

5.如权利要求4所述方法，其中，所述图像识别模型还包括：LSTM长短期记忆模块，用以

6.如权利要求5所述方法，其中，所述图像识别模型还包括：CTC神经网络的时序分类模块，用以

7.如权利要求1所述方法，其中，所述获取包含金融票据的待处理图像之后，包括：对所述待处理图像进行倾斜校正、图像去噪、二值化中的任意一种或多种处理。

8.一种金融票据识别装置，其中，所述装置包括：

9.一种电子设备，包括：

10.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行所述权利要求1～7之任一所述方法。

...

【技术特征摘要】

1.一种金融票据识别方法，其中，所述方法包括：

2.如权利要求1所述方法，其中，所述通过预先训练的图像识别模型，识别出所述待处理图像中金融票据的文字信息，包括：

4.如权利要求1所述方法，其中，所述图像识别模型包括cnn卷积神经网络特征提取模块，所述cnn卷积神经网络特征提取模块包括：

5.如权利要求4所述方法，其中，所述图像识...

【专利技术属性】
技术研发人员：刘鑫，胡美鑫，范丽文，周佳成，陈磊，
申请(专利权)人：中国邮政储蓄银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人