一种文字识别与自动化审核方法和系统技术方案

技术编号:43629672 阅读:38 留言:0更新日期:2024-12-11 15:09
本申请公开了一种文字识别与自动化审核方法和系统,通过获取包括半结构化和非结构化在内的所有待审核文档数据,确保审核过程的全面性,利用OCR技术准确识别文档内容,将其转化为可操作的结构化数据,通过规则抽取和模型抽取两种方式,选取文档中的关键信息,提升了信息处理的效率和准确性,与预先搭建的目标结构化文本数据进行对比,自动化地完成合规性检查,确保审核结果的合规性,根据文档的复杂度实时更新置信度阈值,适应不同复杂度的文档数据,自动化的审核流程显著提高了审核效率,在处理大量文档数据时,能够节省大量时间和人力资源,输出审核结果以及对应置信率,使用户能够看到文档解析的具体结果,提高了审核的可靠性和用户的信任度。

【技术实现步骤摘要】

本申请涉及文字识别与自动化审核,特别是涉及一种文字识别与自动化审核方法和系统


技术介绍

1、随着数字化进程的推进,企业和机构越来越依赖于自动化技术来处理和审核大量非结构化文档数据(如图片、表格、文本文档)。传统的技术方案主要依赖于手工审核,人工对纸质文档进行逐一审查,包括检查发票、合同、审计报告等,效率低下、耗时耗力、容易出错。手工审核方法需要大量人力,耗时耗力,难以应对大规模文档数据的处理需求,手工审核方法容易出现人为错误,尤其在面对大量重复性任务时,错误率较高。因此,现有技术方案难以满足现代企业对高效、准确、灵活和综合性的数据处理需求。


技术实现思路

1、本申请提供一种文字识别与自动化审核方法和系统,旨在解决现有技术难以满足现代企业对高效、准确、灵活和综合性的数据处理需求的问题。

2、第一方面,一种文字识别与自动化审核方法,所述方法包括:

3、获取待审核文档数据,其中,所述待审核文档数据包括半结构化文档数据和非结构化文本数据;

4、根据所述待审核文档数据内容获取对应o本文档来自技高网...

【技术保护点】

1.一种文字识别与自动化审核方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述半结构化文本数据包括表格文档数据,所述非结构化文本数据包括图片文档数据和文本文档数据。

3.根据权利要求2所述的方法,其特征在于,根据所述待审核文档数据内容获取对应OCR引擎,包括:

4.根据权利要求1所述的方法,其特征在于,所述规则抽取包括以下步骤:

5.根据权利要求1所述的方法,其特征在于,所述模型抽取包括以下步骤:

6.根据权利要求1所述的方法,其特征在于,所述通过对比所述目标文档数据与预先搭建的目标结构化文本数据,...

【技术特征摘要】

1.一种文字识别与自动化审核方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述半结构化文本数据包括表格文档数据,所述非结构化文本数据包括图片文档数据和文本文档数据。

3.根据权利要求2所述的方法,其特征在于,根据所述待审核文档数据内容获取对应ocr引擎,包括:

4.根据权利要求1所述的方法,其特征在于,所述规则抽取包括以下步骤:

5.根据权利要求1所述的方法,其特征在于,所述模型抽取包括以下步骤:

6.根据权利要求1所述的方法,其特征在于,所述通过对比所述...

【专利技术属性】
技术研发人员:王开向王涌陈琛王开志龚峰平彭超李奇奇
申请(专利权)人:北京至臻云智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1