System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据提取与稽核方法、装置、计算机设备及存储介质制造方法及图纸_技高网

一种数据提取与稽核方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:41322689 阅读:2 留言:0更新日期:2024-05-13 15:01
本申请属于人工智能领域,涉及一种数据提取与稽核方法,包括获取目标原始业务数据,对目标原始业务数据进行识别提取,得到待处理业务数据;对待处理业务数据进行数据结构化处理,获得结构化目标业务数据;根据目标业务确定稽核字段,获取稽核字段对应的稽核数据值;按照预设的字段映射确定结构化目标业务数据中与稽核字段对应的目标业务字段;基于预设的比对规则,将目标业务字段的目标业务数据值与对应的稽核数据值进行比对,得到稽核结果。本申请还提供一种数据提取与稽核装置、计算机设备及存储介质。本申请能够将多业务系统数据打通,使整个业务流程数据贯通透明,提高业务数据的识别准确率,实现了数据的智能化稽核。

【技术实现步骤摘要】

本申请涉及人工智能和金融科技,尤其涉及一种数据提取与稽核方法、装置、计算机设备及存储介质


技术介绍

1、机器人流程自动化(robotic process automation,简称rpa),是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。ocr(optical characterrecognition,光学字符识别)和rpa作为人工智能的组成部分,其技术的核心能力是进行对比的文件内容进行识别和提取,并且通过预设的线下表规则和智能算法来模拟和替代人工,能够依附在各种业务系统按照规则与要求完成不同业务的组织能力,为智能化信息应用提供了基础。目前ocr与rpa技术的结合主要应用于各个行业,尤其需要进行多系统业务处理以及花费大量时间进行数据处理的业务。但是,上述应用目前对rpa技术的利用仅停留在具体场景的单一业务中,没有将ocr融入rpa机器人处理的多种关联性业务,造成涉及多部门协作的业务存在协同效率低、业务流程冗长、跨系统多人工操作存在较多问题的情况,业务在实际执行过程中因为数据提取的准确性较低导致后续数据稽核存在多重业务风险,且难以追溯问题根源。


技术实现思路

1、本申请实施例的目的在于提出一种数据提取与稽核方法、装置、计算机设备及存储介质,以解决现有技术中业务数据稽核方式耗费大量人力、业务执行效率低、业务数据识别准确率低以及问题根源难以追溯的技术问题。

2、为了解决上述技术问题,本申请实施例提供一种数据提取与稽核方法,采用了如下所述的技术方案

3、获取目标原始业务数据,对所述目标原始业务数据进行识别提取,得到待处理业务数据;

4、对所述待处理业务数据进行数据结构化处理,获得结构化目标业务数据;

5、根据所述目标业务确定稽核字段,获取所述稽核字段对应的稽核数据值;

6、按照预设的字段映射确定所述结构化目标业务数据中与所述稽核字段对应的目标业务字段;

7、基于预设的比对规则,将所述目标业务字段的目标业务数据值与对应的所述稽核数据值进行比对,得到稽核结果。

8、进一步的,所述对所述目标原始业务数据进行识别提取,得到待处理业务数据的步骤包括:

9、识别所述目标原始业务数据的数据元素,得到元素识别结果,其中,所述数据元素包括图片和文本;

10、将所述元素识别结果输入训练好的分割模型中进行元素分割,得到图片数据和文本数据;

11、分别对所述图片数据和所述文本数据进行文字识别,得到待处理业务数据。

12、进一步的,所述分别对所述图片数据和所述文本数据进行文字识别,得到待处理业务数据的步骤包括:

13、利用光学字符识别对所述图片数据进行识别,得到第一业务数据;

14、对所述文本数据进行识别,得到第二业务数据;

15、将所述第一业务数据和所述第二业务数据进行结合,得到待处理业务数据。

16、进一步的,所述对所述待处理业务数据进行数据结构化处理,获得结构化目标业务数据的步骤包括:

17、按照预设业务规则确定目标业务字段,根据所述目标业务字段创建业务数据表;

18、从所述待处理业务数据中获取与所述目标业务字段对应的目标业务数据值;

19、将所述目标业务数据值填充至所述业务数据表对应的表格位置,得到结构化目标业务数据。

20、进一步的,所述基于预设的比对规则,将所述目标业务字段的目标业务数据值与对应的所述稽核数据值进行比对,得到稽核结果的步骤包括:

21、分别构建所述目标业务数据值与所述稽核数据值对应的第一字符串和第二字符串;

22、根据所述第一字符串和所述第二字符串构建比对矩阵;

23、根据所述比对矩阵计算得到稽核结果。

24、进一步的,所述根据所述比对矩阵计算得到稽核结果的步骤包括:

25、根据所述第一字符串的第一长度和所述第二字符串的第二长度,计算匹配窗口值;

26、基于所述比对矩阵和所述匹配窗口值,计算匹配字符数和匹配字符换位数;

27、根据所述第一长度、所述第二长度、所述匹配字符数以及所述匹配字符换位数,计算字符串相似度;

28、确定所述第一字符串和所述第二字符串的公共前缀长度,并根据所述公共前缀长度和所述字符串相似度计算匹配度,将所述匹配度作为所述稽核结果。

29、进一步的,在所述得到稽核结果的步骤之后还包括:

30、在所述业务数据表中增加稽核状态字段,并将稽核结果填充至所述稽核状态字段处。

31、为了解决上述技术问题,本申请实施例还提供一种数据提取与稽核装置,采用了如下所述的技术方案:

32、获取模块,用于获取目标原始业务数据,对所述目标原始业务数据进行识别提取,得到待处理业务数据;

33、结构化模块,用于对所述待处理业务数据进行数据结构化处理,获得结构化目标业务数据;

34、字段确定模块,用于根据所述目标业务确定稽核字段,获取所述稽核字段对应的稽核数据值;

35、映射模块,用于按照预设的字段映射确定所述结构化目标业务数据中与所述稽核字段对应的目标业务字段;

36、稽核模块,用于基于预设的比对规则,将所述目标业务字段的目标业务数据值与对应的所述稽核数据值进行比对,得到稽核结果。

37、为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:

38、该计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的数据提取与稽核方法的步骤。

39、为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:

40、所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的数据提取与稽核方法的步骤。

41、与现有技术相比,本申请实施例主要有以下有益效果:

42、本申请通过rpa技术将多业务系统数据打通,自动获取目标原始业务数据,并对目标原始业务数据进行识别提取,提高业务数据的识别准确率;通过对提取的待处理业务数据进行结构化处理,能够实现数据格式的统一性加工;根据预设的比对规则对目标业务数据和稽核数据进行比对,实现了数据的智能化稽核,从而提升整个流程各个环节的准确性,提高稽核效率和准确率;此外,统一的数据流通道,使整个业务流程数据贯通透明,提高管理安全性、出现问题容易追溯。

本文档来自技高网...

【技术保护点】

1.一种数据提取与稽核方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的数据提取与稽核方法,其特征在于,所述对所述目标原始业务数据进行识别提取,得到待处理业务数据的步骤包括:

3.根据权利要求2所述的数据提取与稽核方法,其特征在于,所述分别对所述图片数据和所述文本数据进行文字识别,得到待处理业务数据的步骤包括:

4.根据权利要求1所述的数据提取与稽核方法,其特征在于,所述对所述待处理业务数据进行数据结构化处理,获得结构化目标业务数据的步骤包括:

5.根据权利要求1所述的数据提取与稽核方法,其特征在于,所述基于预设的比对规则,将所述目标业务字段的目标业务数据值与对应的所述稽核数据值进行比对,得到稽核结果的步骤包括:

6.根据权利要求5所述的数据提取与稽核方法,其特征在于,所述根据所述比对矩阵计算得到稽核结果的步骤包括:

7.根据权利要求4所述的数据提取与稽核方法,其特征在于,在所述得到稽核结果的步骤之后还包括:

8.一种数据提取与稽核装置,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的数据提取与稽核方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的数据提取与稽核方法的步骤。

...

【技术特征摘要】

1.一种数据提取与稽核方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的数据提取与稽核方法,其特征在于,所述对所述目标原始业务数据进行识别提取,得到待处理业务数据的步骤包括:

3.根据权利要求2所述的数据提取与稽核方法,其特征在于,所述分别对所述图片数据和所述文本数据进行文字识别,得到待处理业务数据的步骤包括:

4.根据权利要求1所述的数据提取与稽核方法,其特征在于,所述对所述待处理业务数据进行数据结构化处理,获得结构化目标业务数据的步骤包括:

5.根据权利要求1所述的数据提取与稽核方法,其特征在于,所述基于预设的比对规则,将所述目标业务字段的目标业务数据值与对应的所述稽核数据值进行比对,得到稽核结果的步...

【专利技术属性】
技术研发人员:管键梓张甜罗远军吴燕青陈家荣陈小燕
申请(专利权)人:远光软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1