一种凭证信息识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：40935705 阅读：2 留言：0更新日期：2024-04-18 14:55

本发明专利技术提供了一种凭证信息识别方法、装置、计算机设备和存储介质。所述方法包括：获取待识别凭证信息；对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文；基于所述噪声图文信息对所述待识别凭证信息进行剥离，得到待填充图文；对所述待填充图文进行预测填充，得到预测填充集；根据预设的置信阈值对所述预测填充集中的预测图文进行提取，得到目标图文信息，以提升了对于一些生僻和比较相似的字符的准确率以及凭证文本识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据识别领域及金融领域，尤其涉及一种凭证信息识别方法、装置、计算机设备和存储介质。

技术介绍

1、目前在金融领域中，主要运用ocr技术识别票据、合同以及保单等中包含的文本信息，通常通过rnn的文字识别算法，结合cnn网络提取图像特征后，运用rnn网络对文本特征序列进行预测，再通过ctc或注意力机制实现对预测到的文本特征序列进行解码，但该方法由于是seq2seq的运行机制，随着上述特征序列的增长，容易导致在计算过程中造成信息丢失的问题，而且该方法容易引发长期依赖、占用内存大以及训练速度慢等问题；另一种方法是基于transformer模型的文字识别算法，存在无法充分理解图像信息的分布构造的问题，对于一些生僻和比较相似的字符，会很大概率识别错误；因此针对上述问题，应提出一种方法，以提升文本识别的准确率。

技术实现思路

1、本专利技术的主要目的在于提供了一种凭证信息识别方法、装置、计算机设备和存储介质，旨在解决提升文本识别的准确率的技术问题。

2、为实现上述目的，本专利技术提供一种凭证信息识别方法，该方法包括：

3、获取待识别凭证信息；

4、对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文；

5、基于所述噪声图文信息对所述待识别凭证信息进行剥离，得到待填充图文；

6、对所述待填充图文进行预测填充，得到预测填充集；

7、根据预设的置信阈值对所述预测填充集中的预测图文进行提取，得到目标图文信息。

8、可选地，对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文之前，还包括：

9、获取图文训练数据和待训练图文识别模型；

10、对所述图文训练数据中的目标文本样本和目标图片样本进行图文样本扩散，得到扩散图文训练集；

11、基于所述扩散图文训练集，确定所述待训练图文识别模型的目标损失函数；

12、基于所述目标损失函数对所述待训练图文识别模型进行迭代训练，获得训练好的图文识别模型。

13、可选地，所述对所述图文训练数据中的目标文本样本和目标图片样本进行图文样本扩散，具体包括：

14、获取基于扩散模型构建的文字扩散模型；

15、将所述目标文本输入至所述文字扩散模型进行图片扩散，得到对应的扩散图片，其中，所述扩散图片的特征与所述目标文本特征一致；

16、获取基于扩散模型构建的图片扩散模型；

17、将所述目标图片输入至所述图片扩散模型进行文本扩散，得到对应的扩散文本，其中，所述扩散文本的特征与所述目标图片特征一致。

18、可选地，所述基于所述扩散图文训练集，确定所述待训练图文识别模型的目标损失函数，包括：

19、将所述扩散图文训练集进行特征序列化，得到第一序列；

20、基于所述第一序列，确定所述图文识别模型中编码器对应的第一损失函数；

21、基于所述编码器的输出结果确定第二序列；

22、基于所述第二序列关联的图文数据和所述扩散图文训练集据中包含的扩散图片样本和扩散文本样本，确定所述图文识别模型解码器对应的第二损失函数。

23、可选地，所述文字扩散模型包括图片编码器和文本解码器，所述得到扩散图文训练集之前，还包括：

24、将所述目标文本输入至所述图片编码器进行图片特征编码，得到所述目标文本对应的图片特征序列；

25、将基于马尔卡夫链构建的随机噪声矩阵输入至所述图片特征序列，得到待解码图片特征；

26、利用所述文本解码器对所述解码图片特征进行解码，得到所述扩散文本。

27、可选地，所述图片扩散模型包括文本编码器和图片解码器，所述得到扩散图文训练集之前，还包括：

28、将所述目标图片输入至所述文本编码器进行文本特征编码，得到所述目标图片对应的文本特征序列；

29、将基于马尔卡夫链构建的随机噪声矩阵输入至所述文本特征序列，得到待解码文本特征；

30、利用所述图片解码器对所述待解码文本特征进行解码，得到所述扩散图片。

31、可选地，所述对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文之后，还包括:

32、对所述噪声图文进行关联关系识别；

33、若所述噪声图文无关联关系；则对所述噪声图文进行剔除操作；

34、若所述噪声图文有关联关系，则对所述噪声图文执行修正处理操作，得到修正噪声图文。

35、此外，为实现上述目的，本专利技术还提供一种凭证信息识别装置，所述凭证信息识别装置包括：

36、数据获取模块，用于获取待识别凭证信息；

37、噪声生成模块，用于对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文；

38、噪声剥离模块，用于基于所述噪声图文信息对所述待识别凭证信息进行剥离，得到待填充图文；

39、预测填充模块，用于对所述待填充图文进行预测填充，得到预测填充集；

40、目标提取模型，用于根据预设的置信阈值对所述预测填充集中的预测图文进行提取，得到目标图文信息。

41、为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

42、所述计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现本申请实施例中提出的任一项所述的凭证信息识别方法的步骤。

43、为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

44、所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现本申请实施例中提出的任一项所述的凭证信息识别方法的步骤。

45、与现有技术相比，本申请实施例主要有以下有益效果：

46、本专利技术提供了一种凭证信息识别方法、装置、计算机设备和存储介质。所述方法包括：获取待识别凭证信息；对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文；基于所述噪声图文信息对所述待识别凭证信息进行剥离，得到待填充图文；对所述待填充图文进行预测填充，得到预测填充集；根据预设的置信阈值对所述预测填充集中的预测图文进行提取，得到目标图文信息，以提升了对于一些生僻和比较相似的字符的准确率以及凭证文本识别的准确率。

本文档来自技高网...

【技术保护点】

1.一种凭证信息识别方法，其特征在于，包括：

2.如权利要求1所述的方法，所述对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文之前，还包括：

3.如权利要求2所述的方法，其特征在于，所述对所述图文训练数中的目标文本样本和目标图片样本进行图文样本扩散，具体包括：

4.如权利要求2所述的方法，其特征在于，所述基于所述扩散图文训练集，确定所述待训练图文识别模型的目标损失函数，包括：

5.如权利要求2所述的方法，其特征在于，所述文字扩散模型包括图片编码器和文本解码器，所述得到扩散图文训练集之前，还包括：

6.如权利要求3所述的方法，其特征在于，所述图片扩散模型包括文本编码器和图片解码器，所述得到扩散图文训练集之前，还包括：

7.如权利要求1所述的方法，其特征在于，所述对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文之后，还包括:

8.一种凭证信息识别装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的凭证信息识别方法的步骤。

...

【技术特征摘要】

1.一种凭证信息识别方法，其特征在于，包括：

2.如权利要求1所述的方法，所述对所述待识别凭证信息包含的噪声信息进行识别，生成对应的噪声图文之前，还包括：

3.如权利要求2所述的方法，其特征在于，所述对所述图文训练数中的目标文本样本和目标图片样本进行图文样本扩散，具体包括：

4.如权利要求2所述的方法，其特征在于，所述基于所述扩散图文训练集，确定所述待训练图文识别模型的目标损失函数，包括：

5.如权利要求2所述的方法，其特征在于，所述文字扩散模型包括图片编码器和文本解码器，所述得到扩散图文训练集之前，还包括：

6.如权利要求3所述的方法，其特征在于，所述图片扩散...

【专利技术属性】
技术研发人员：刘颖，刁梁，
申请(专利权)人：中国平安财产保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人