当前位置: 首页 > 专利查询>尤帕斯公司专利>正文

表单提取器制造技术

技术编号:34877600 阅读:33 留言:0更新日期:2022-09-10 13:33
本系统和方法总体涉及机器人流程自动化领域,尤其涉及用于文档处理的表单数据提取器。该系统和方法涉及一种使用可以针对不同的文档类型而被轻松配置的RPA工作流进行文档处理的表单提取器。表单提取器包括用于标识文档类型(分类)和从文档提取数据的一组模板。模板可以由用户配置,即通过定义要被提取的字段和字段在文档上的位置。表单提取器对页面上模板位置的改变以及扫描旋转、大小、质量、倾斜角度变化和文件格式具有弹性,从而允许RPA流程从需要摄取的文档中提取数据,而与它们是如何被创建的无关。创建的无关。创建的无关。

【技术实现步骤摘要】
【国外来华专利技术】表单提取器
[0001]相关申请的交叉引用
[0002]本申请要求于2020年12月31日提交的美国申请号17/139,408的优选权益,其内容以引用的方式并入本文。

技术介绍

[0003]与从文档中提取数据相关联的技术要求用户标识文档中的字段以手动提取数据。从类似文档中提取数据是一项重复性任务,通常会浪费时间和技能,尤其是手动执行时。使用不同的算法技术例如机器学习和基于规则的配置,已经创建了用于配置从文档中提取数据的工具。

技术实现思路

[0004]本系统和方法总体涉及机器人流程自动化领域,尤其涉及用于文档处理的表单数据提取器。该系统和方法涉及使用可以针对不同的文档类型而轻松被配置的RPA工作流进行文档处理的表单提取器。表单提取器包括用于标识文档类型(分类)和从文档中提取数据的一组模板。模板可以由用户配置,即通过定义要提取的字段和字段在文档上的位置。表单提取器对页面上模板位置的变化以及扫描旋转、大小、质量、倾斜角度变化和文件格式具有弹性,从而允许RPA流程从需要摄取的文档中提取数据,而与它们是如何创建的无关。
>附图说明
本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种执行用于文档处理的数据提取的方法:通过定义要被提取的字段和所述字段在所述文档中的位置来配置多个模板中的一个模板;使用所述多个模板来标识文档类型;以及基于所述标识,使用针对所述多个模板中的已配置的所述一个模板的要被提取的字段以及所述字段中的每个字段在所述文档内的位置,从所述文档提取数据。2.根据权利要求1所述的方法,还包括:通过利用来自对所提取的所述数据的验证的反馈增强模板信息,来提高所执行的数据提取的准确度。3.根据权利要求1所述的方法,其中所述模板包括字段级设置。4.根据权利要求1所述的方法,其中所述字段级设置包括锚点。5.根据权利要求1所述的方法,还包括定义一般分类法。6.根据权利要求5所述的装置,其中所述定义包括:提供界面,所述界面促进对以分类和数据提取为目标的一列文档类型的定义,所述一列文档类型具有针对所述文档类型中的每个文档类型的相关联字段;以及接收已定义的所述一列文档类型和针对已定义的所述文档类型中的每个文档类型的相关联字段。7.根据权利要求5所述的方法,还包括存储所定义的所述一般分类法。8.根据权利要求7所述的方法,其中所述存储包括在主分类法数据结构中存储所述一列文档类型和所述相关联字段。9.根据权利要求1所述的方法,还包括在RPA工作流中执行数字化活动。10.根据权利要求9所述的方法,其中所述数字化活动使用多个OCR引擎,并且所述数字化活动包括:实现针对所述多个OCR引擎的投票系统以及输出来自所述多个OCR引擎的最...

【专利技术属性】
技术研发人员:I
申请(专利权)人:尤帕斯公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1