【技术实现步骤摘要】
本申请涉及文字识别与自动化审核,特别是涉及一种文字识别与自动化审核方法和系统。
技术介绍
1、随着数字化进程的推进,企业和机构越来越依赖于自动化技术来处理和审核大量非结构化文档数据(如图片、表格、文本文档)。传统的技术方案主要依赖于手工审核,人工对纸质文档进行逐一审查,包括检查发票、合同、审计报告等,效率低下、耗时耗力、容易出错。手工审核方法需要大量人力,耗时耗力,难以应对大规模文档数据的处理需求,手工审核方法容易出现人为错误,尤其在面对大量重复性任务时,错误率较高。因此,现有技术方案难以满足现代企业对高效、准确、灵活和综合性的数据处理需求。
技术实现思路
1、本申请提供一种文字识别与自动化审核方法和系统,旨在解决现有技术难以满足现代企业对高效、准确、灵活和综合性的数据处理需求的问题。
2、第一方面,一种文字识别与自动化审核方法,所述方法包括:
3、获取待审核文档数据,其中,所述待审核文档数据包括半结构化文档数据和非结构化文本数据;
4、根据所述待审核文
...【技术保护点】
1.一种文字识别与自动化审核方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述半结构化文本数据包括表格文档数据,所述非结构化文本数据包括图片文档数据和文本文档数据。
3.根据权利要求2所述的方法,其特征在于,根据所述待审核文档数据内容获取对应OCR引擎,包括:
4.根据权利要求1所述的方法,其特征在于,所述规则抽取包括以下步骤:
5.根据权利要求1所述的方法,其特征在于,所述模型抽取包括以下步骤:
6.根据权利要求1所述的方法,其特征在于,所述通过对比所述目标文档数据与预先搭建的
...【技术特征摘要】
1.一种文字识别与自动化审核方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述半结构化文本数据包括表格文档数据,所述非结构化文本数据包括图片文档数据和文本文档数据。
3.根据权利要求2所述的方法,其特征在于,根据所述待审核文档数据内容获取对应ocr引擎,包括:
4.根据权利要求1所述的方法,其特征在于,所述规则抽取包括以下步骤:
5.根据权利要求1所述的方法,其特征在于,所述模型抽取包括以下步骤:
6.根据权利要求1所述的方法,其特征在于,所述通过对比所述...
【专利技术属性】
技术研发人员:王开向,王涌,陈琛,王开志,龚峰平,彭超,李奇奇,
申请(专利权)人:北京至臻云智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。