用于能够使得相关数据从多个文档中被提取的系统和方法技术方案

技术编号:40870233 阅读:26 留言:0更新日期:2024-04-08 16:36
本文公开了能够从文档中提取目标数据的系统和方法。在实施例中,一种能够从文档中提取目标数据的方法包括:访问包括多个文档的数据库,所述多个文档包括目标数据;对于所述多个文档中的每个文档,基于包括所述目标数据的所提取的文本来创建区域张量;对于所述多个文档中的每个文档,基于包括所述目标数据的区来创建标签张量;以及使用所述区域张量和所述标签张量来训练所述提取算法以从附加文档中提取所述目标数据。

【技术实现步骤摘要】
【国外来华专利技术】

概括地说,本公开内容涉及用于使目标数据能够从多个文档中被提取的系统和方法。更具体地说,本公开内容涉及利用来自传统数据库中的文档的信息来训练提取算法以从当前数据库中的文档中提取目标数据的系统和方法。背景信息许多企业在传统数据库中拥有大量旧数据。然而,在某些情况下,这些数据除了保留旧记录外几乎没有什么价值,尤其是在维护传统数据库的技术变得过时的情况下。


技术介绍

1、优先权

2、本专利申请要求享受于2020年10月19日递交的标题为“systems and methodsfor training an extraction algorithm and/or extracting relevant data from aplurality of documents”(用于训练提取算法和/或从多个文档提取相关数据的系统和方法)的美国临时专利申请no.63/093,425的优先权,其完整内容通过引用的方式被并入本文并作为依据。


技术实现思路

1、本公开内容提供了可以利用来自传统数据库的旧数据来训练提取算法的本文档来自技高网...

【技术保护点】

1.一种能够使得目标数据从文档中被提取的方法,所述方法包括:

2.根据权利要求1所述的方法,包括

3.根据权利要求1所述的方法,包括

4.根据权利要求1所述的方法,其中,

5.根据权利要求1所述的方法,其中,

6.根据权利要求1所述的方法,其中,

7.根据权利要求1所述的方法,包括

8.一种存储指令的存储器,所述指令被配置为使处理器执行根据权利要求1所述的方法。

9.一种用于能够使得目标数据从文档中被提取的方法,所述方法包括:

10.根据权利要求9所述的方法,包

11...

【技术特征摘要】
【国外来华专利技术】

1.一种能够使得目标数据从文档中被提取的方法,所述方法包括:

2.根据权利要求1所述的方法,包括

3.根据权利要求1所述的方法,包括

4.根据权利要求1所述的方法,其中,

5.根据权利要求1所述的方法,其中,

6.根据权利要求1所述的方法,其中,

7.根据权利要求1所述的方法,包括

8.一种存储指令的存储器,所述指令被配置为使处理器执行根据权利要求1所述的方法。

9.一种用于能够使得目标数据从文档中被提取的方法,所述方法包括:

10.根据权利要求9所述的方法,包括

11.根据权利要...

【专利技术属性】
技术研发人员:A·F·沙班V·坦德拉D·埃利奥普洛斯A·K·布拉扎伊蒂斯K·穆图克里什南
申请(专利权)人:支点全球技术公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1