System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 表格关系分析方法、装置、计算机设备及存储介质制造方法及图纸_技高网

表格关系分析方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:41328937 阅读:2 留言:0更新日期:2024-05-13 15:07
本申请实施例属于人工智能和金融科技领域,涉及一种表格关系分析方法,包括:识别目标表格中的各词元;通过表格关系分析模型中的特征编码器获取各词元的离散特征,模型包括特征编码器、特征解码器和关系分析网络;将各词元的离散特征输入特征解码器,以根据各单元格实例的特征序列,确定各词元所属的单元格实例,并根据各词元所属单元格实例的特征序列,生成至少一个单元格编码特征,各单元格实例的特征序列预先通过模型训练得到,单元格实例为表格中单元格内的实例;将至少一个单元格编码特征输入关系分析网络,得到目标表格中各单元格之间的配对关系,并根据得到的配对关系生成目标表格的单元格关系分析结果。本申请提高了表格关系分析的效率。

【技术实现步骤摘要】

本申请涉及人工智能和金融科技领域,尤其涉及一种表格关系分析方法、装置、计算机设备及存储介质


技术介绍

1、表格是一种重要的组织整理数据的手段。在很多场景中,为了防止表格内容被篡改以及表格内容的准确性,表格在制成后会以图像的形式进行呈现。在进行信息的自动提取和分析时,经常需要通过计算机获取表格图像中的文字以及文字之间的关系。例如,在金融财会领域,需要自动提取表格单元格中的信息,并分析单元格之间的关系。

2、当前的表格关系分析技术都是采用多阶段系统,先提取文字表征,再构建文字之间的关系,这需要根据不同的表格类型和任务来设计不同的特征工程和处理流程,不具有通用性;并且,依赖于多个独立的组件,需要将信息传递给多个组件,提高了信息传递的复杂性和计算开销,降低了表格关系分析的效率。


技术实现思路

1、本申请实施例的目的在于提出一种表格关系分析方法、装置、计算机设备及存储介质,以提高表格关系分析的效率。

2、为了解决上述技术问题,本申请实施例提供一种表格关系分析方法,采用了如下所述的技术方案:

3、获取目标表格,并识别所述目标表格中的各词元;

4、通过表格关系分析模型中的特征编码器获取所述各词元的离散特征,所述表格关系分析模型包括所述特征编码器、特征解码器和关系分析网络;

5、将所述各词元的离散特征输入所述特征解码器,以由所述特征解码器根据各单元格实例的特征序列,分别确定所述各词元所属的单元格实例,并根据所述各词元所属单元格实例的特征序列,生成至少一个单元格编码特征,所述各单元格实例的特征序列预先通过模型训练得到,单元格实例为表格中单元格内的实例;

6、将所述至少一个单元格编码特征输入所述关系分析网络,得到所述目标表格中各单元格之间的配对关系,并根据得到的配对关系生成所述目标表格的单元格关系分析结果。

7、为了解决上述技术问题,本申请实施例还提供一种表格关系分析装置,采用了如下所述的技术方案:

8、获取识别模块,用于获取目标表格,并识别所述目标表格中的各词元;

9、离散获取模块,用于通过表格关系分析模型中的特征编码器获取所述各词元的离散特征,所述表格关系分析模型包括所述特征编码器、特征解码器和关系分析网络;

10、实例确定模块,用于将所述各词元的离散特征输入所述特征解码器,以由所述特征解码器根据各单元格实例的特征序列,分别确定所述各词元所属的单元格实例,并根据所述各词元所属单元格实例的特征序列,生成至少一个单元格编码特征,所述各单元格实例的特征序列预先通过模型训练得到,单元格实例为表格中单元格内的实例;

11、关系分析模块,用于将所述至少一个单元格编码特征输入所述关系分析网络,得到所述目标表格中各单元格之间的配对关系,并根据得到的配对关系生成所述目标表格的单元格关系分析结果。

12、为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:

13、获取目标表格,并识别所述目标表格中的各词元;

14、通过表格关系分析模型中的特征编码器获取所述各词元的离散特征,所述表格关系分析模型包括所述特征编码器、特征解码器和关系分析网络;

15、将所述各词元的离散特征输入所述特征解码器,以由所述特征解码器根据各单元格实例的特征序列,分别确定所述各词元所属的单元格实例,并根据所述各词元所属单元格实例的特征序列,生成至少一个单元格编码特征,所述各单元格实例的特征序列预先通过模型训练得到,单元格实例为表格中单元格内的实例;

16、将所述至少一个单元格编码特征输入所述关系分析网络,得到所述目标表格中各单元格之间的配对关系,并根据得到的配对关系生成所述目标表格的单元格关系分析结果。

17、为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:

18、获取目标表格,并识别所述目标表格中的各词元;

19、通过表格关系分析模型中的特征编码器获取所述各词元的离散特征,所述表格关系分析模型包括所述特征编码器、特征解码器和关系分析网络;

20、将所述各词元的离散特征输入所述特征解码器,以由所述特征解码器根据各单元格实例的特征序列,分别确定所述各词元所属的单元格实例,并根据所述各词元所属单元格实例的特征序列,生成至少一个单元格编码特征,所述各单元格实例的特征序列预先通过模型训练得到,单元格实例为表格中单元格内的实例;

21、将所述至少一个单元格编码特征输入所述关系分析网络,得到所述目标表格中各单元格之间的配对关系,并根据得到的配对关系生成所述目标表格的单元格关系分析结果。

22、与现有技术相比,本申请实施例主要有以下有益效果:获取目标表格后,识别目标表格中的各词元;本申请借助表格关系分析模型实现端到端的表格关系分析,表格关系分析模型包括特征编码器、特征解码器和关系分析网络;通过特征编码器可以获取各词元的离散特征;特征解码器中具有可能出现的各单元格实例的特征序列,特征解码器根据各特征序列对各词元的离散特征进行解码,确定各词元所属的单元格实例,并根据各词元所属单元格实例的特征序列,生成至少一个单元格编码特征,对涉及到的单元格实现了特征表示;将至少一个单元格编码特征输入关系分析网络,以识别目标表格中各单元格之间的配对关系,并根据得到的配对关系生成目标表格的单元格关系分析结果,实现了端到端的表格关系分析,表征建模方式通用性更强,不必设置多个独立的组件,提高了表格关系分析的效率。

本文档来自技高网...

【技术保护点】

1.一种表格关系分析方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的表格关系分析方法,其特征在于,所述识别所述目标表格中的各词元的步骤包括:

3.根据权利要求2所述的表格关系分析方法,其特征在于,在所述识别所述目标表格中的各词元的步骤之后,还包括:

4.根据权利要求3所述的表格关系分析方法,其特征在于,所述通过表格关系分析模型中的特征编码器获取所述各词元的离散特征的步骤包括:

5.根据权利要求4所述的表格关系分析方法,其特征在于,所述分别将所述各词元各自的词元编码和坐标编码进行融合,得到所述各词元的初始离散特征的步骤包括:

6.根据权利要求1所述的表格关系分析方法,其特征在于,所述由所述特征解码器根据各单元格实例的特征序列,分别确定所述各词元所属的单元格实例,并根据所述各词元所属单元格实例的特征序列,生成至少一个单元格编码特征的步骤包括:

7.根据权利要求1所述的表格关系分析方法,其特征在于,在所述获取目标表格的步骤之前,还包括:

8.一种表格关系分析装置,其特征在于,包括:

>9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的表格关系分析方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的表格关系分析方法的步骤。

...

【技术特征摘要】

1.一种表格关系分析方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的表格关系分析方法,其特征在于,所述识别所述目标表格中的各词元的步骤包括:

3.根据权利要求2所述的表格关系分析方法,其特征在于,在所述识别所述目标表格中的各词元的步骤之后,还包括:

4.根据权利要求3所述的表格关系分析方法,其特征在于,所述通过表格关系分析模型中的特征编码器获取所述各词元的离散特征的步骤包括:

5.根据权利要求4所述的表格关系分析方法,其特征在于,所述分别将所述各词元各自的词元编码和坐标编码进行融合,得到所述各词元的初始离散特征的步骤包括:

6.根据权利要求1所述的表格关系分析方法,其特征在于,所述由所述特征解码器根据...

【专利技术属性】
技术研发人员:刁梁
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1