一种用于会计底稿录入的OCR识别的方法技术

技术编号：38587609 阅读：27 留言：0更新日期：2023-08-26 23:29

本发明专利技术提出了一种用于会计底稿录入的OCR识别的方法，所述方法包括如下步骤：通过分类器对底稿数据进行分类，并将分类数据进行图像数据采集；通过循环神经网络对采集数据进行去噪，并分配图像数据权重倾斜，对噪点进行模糊；对会计底稿图像中的加权信息进行特征提取：在进行特征提取后，将会计底稿中的文字信息建立字词组模型，数字信息建立符号模型；将字词组模型和符号模型中的数据进行备存，并将采集的文字信息与数字信息进行扫描识别。目前在录入会计底稿中的数字和文本时，困难主要体现在以下几个方面，文字变形，由于会计底稿中的文字可能存在变形的情况，导致录入的结果不准确。字符模糊，由于会计底稿中的字符可能存在模糊等问题。等问题。等问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于会计底稿录入的OCR识别的方法

[0001]本专利技术属于OCR识别领域，特别涉及一种用于会计底稿录入的OCR识别的方法。

技术介绍

[0002]传统的业务票据识别主要是以人工方式进行，财务相关人员依照票据内容手动将票据内容输入Excel等文件或者数据库之中。这种方式的坏处是工作量大，容易出错，并且重复性高，当企业的业务量增大，票据种类，数据增多的时候话费的人力成本是巨大的，特别是在财务领域，对票据内容，特别是与金额相关的要素信息要求准确率很高。于是在这种场景下提出了利用计算机图像识别软件与传统财务云平台整合的思路，将人工识别票据内容交由计算机图像识别软件来完成。从而节省人力成本，与此同时，由于计算机识别的速度远远高于人工，由此财务数据响应更快。
[0003]现代工业、商业、日常经济活动的繁荣，促使人们频繁适用发票等财务票据，而常规手动管理财务票据费时费力。在现实财务处理发票数据工作中，越来越多的发票需要整理，越来越多的时间耗费在发票上，手动录入和人工检索，不仅浪费时间，且容易出错。随着信息技术的发展，这项工作大多交由计算机完成，因此借助信息化手段，提高财务票据信息处理能力、处理效率、准确率，实现财务票据自动识别是解决问题的有效途径。
[0004]传统的OCR光学字符识别技术主要是为提高人机在处理信息时，人类效率明显落后于机器的矛盾，使人机之间的信息交流高速且有效。OCR技术出现后，随着技术的不断更新与发展，OCR技术在人类经济活动与日常生活中的各个领域开始崭露头角发挥作用，目前也已经有了较成...

【技术保护点】

【技术特征摘要】
1.一种用于会计底稿录入的OCR识别的方法，其特征在于，所述方法包括如下步骤：通过分类器对底稿数据进行分类，并将分类数据进行图像数据采集；通过循环神经网络对采集数据进行去噪，并分配图像数据权重倾斜，对噪点进行模糊；对会计底稿图像中的加权信息进行特征提取：在进行特征提取后，将会计底稿中的文字信息建立字词组模型，数字信息建立符号模型；将字词组模型和符号模型中的数据进行备存，并将采集的文字信息与数字信息进行扫描识别。2.如权利要求1所述的一种用于会计底稿录入的OCR识别的方法，其特征在于：所述分类器采用机器学习算法进行分类，首先通过分析会计底稿样本的特征，根据样本的特征，对样本进行评估，计算样本的分类结果，确定归属于对应类别。3.如权利要求1所述的一种用于...

【专利技术属性】
技术研发人员：权博，王辉辉，卫兵兵，张芳，石磊，
申请(专利权)人：陕西联兴网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人