System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 表格解析模型的训练方法、表格解析方法和装置制造方法及图纸_技高网

表格解析模型的训练方法、表格解析方法和装置制造方法及图纸

技术编号:40303851 阅读:5 留言:0更新日期:2024-02-07 20:49
本申请涉及一种表格解析模型的训练方法、表格解析方法、装置、计算机设备和存储介质。该训练方法包括:获取带有标注信息的样本表格图像;利用表格解析模型对所述样本表格图像进行预测,得到预测结果,并根据所述预测结果和所述标注信息确定目标损失,根据所述目标损失对所述表格解析模型进行调整参数;该表格解析模型用于:对所述样本表格图像进行特征提取,得到样本视觉特征;对所述样本视觉特征和位置编码进行编码和解码,得到预测结果,所述预测结果包括所述样本表格图像中每个单元格的预测位置、每个单元格的预测类别和每个所述单元格之间的预测连接关系。模型能够准确的识别表格中单元格,提高了表格识别的准确性。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种表格解析模型的训练方法、表格解析方法、装置、计算机设备、计算机可读存储介质。


技术介绍

1、随着互联网技术的发展,产生了大量的信息,文档是保存信息的重要途径,其中,表格是文档中较为常见且直观的一种信息组织形式,包含了很多结构化的信息,获取这些结构化信息有助于构建庞大的数据库来进行数据的存储和管理。

2、传统技术中,为了从图像形式的文档表格中解析出所需的结构化信息,采用的是光学字符识别(optical character recognition,ocr)技术识别出文本行和文本内容,然后进行聚类得到表格的结构。

3、然而,通过ocr技术的识别结果来得到表格结构的准确性较低。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种表格解析模型的训练方法、表格解析方法、装置、计算机设备和计算机可读存储介质。

2、第一方面,本申请实施例提供了一种表格解析模型的训练方法,包括:

3、获取带有标注信息的样本表格图像,所述标注信息包括所述样本表格图像中每个单元格的标注位置、每个单元格的标注类别和每个单元格之间的标注连接关系;

4、利用表格解析模型对所述样本表格图像进行预测,得到预测结果,并根据所述预测结果和所述标注信息确定目标损失,根据所述目标损失对所述表格解析模型进行调整参数;其中,所述表格解析模型用于:对所述样本表格图像进行特征提取,得到样本视觉特征;对所述样本视觉特征和位置编码进行编码,得到样本编码特征和单元格的初始位置;对所述样本编码特征和所述单元格的初始位置进行解码,得到预测结果,所述预测结果包括所述样本表格图像中每个单元格的预测位置、每个单元格的预测类别和每个所述单元格之间的预测连接关系。

5、本申请实施例中,该表格解析模型训练过程中将表格中单元格的位置、类别和连接关系的识别精度作为训练的目标,利用更多的样本表格图像来训练,不断的迭代学习表格中的每个单元格的位置、每个单元格的类别和单元格之间的连接关系,使得模型更加关注单元格的位置、类别和连接关系,从而让模型对单元格的位置、类别和连接关系识别的精度更高,提高了模型训练的准确性。

6、第二方面,本申请实施例提供了一种表格解析方法,包括:

7、获取待解析表格图像;

8、利用表格解析模型对所述待解析表格图像进行解析,得到解析结果,所述解析结果包括所述待解析表格图像中每个单元格的位置和每个单元格的类别;其中,所述表格解析模型用于:对待解析表格图像进行特征提取,得到视觉特征;对所述视觉特征和位置编码进行编码,得到编码特征;对所述目标编码特征进行解码,得到解析结果;

9、根据每个所述单元格的位置和每个所述单元格的类别确定表格结构。

10、本申请实施例中,通过上述不断的迭代学习表格中的每个单元格的位置、每个单元格的类别和单元格之间的连接关系训练得到表格解析模型,能够准确的识别表格中每个单元格的位置、类别和连接关系,可以准确的分辨出哪些单元格属于同一单元格,哪些单元格是独立单元格,从而可以根据表格中每个单元格的位置和类别确定表格结构,避免出现同一单元格被拆分识别,以及不同单元格被识别同一个单元格的情况。

11、第三方面,本申请实施例提供了一种表格解析模型的训练装置,包括:

12、图像获取单元,用于获取带有标注信息的样本表格图像,所述标注信息包括所述样本表格图像中每个单元格的标注位置、每个单元格的标注类别和每个单元格之间的标注连接关系;

13、模型训练单元,用于利用表格解析模型对所述样本表格图像进行预测,得到预测结果,并根据所述预测结果和所述标注信息确定目标损失,根据所述目标损失对所述表格解析模型进行调整参数;其中,所述表格解析模型用于:对所述样本表格图像进行特征提取,得到样本视觉特征;对所述样本视觉特征和位置编码进行编码,得到样本编码特征和单元格的初始位置;对所述样本编码特征和所述单元格的初始位置进行解码,得到预测结果,所述预测结果包括所述样本表格图像中每个单元格的预测位置、每个单元格的预测类别和每个所述单元格之间的预测连接关系。

14、第四方面,本申请实施例提供一种表格解析装置,包括:

15、图像获取单元,用于获取待解析表格图像;

16、表格解析单元,用于利用表格解析模型对所述待解析表格图像进行解析,得到解析结果,所述解析结果包括所述待解析表格图像中每个单元格的位置和每个单元格的类别;其中,所述表格解析模型用于:对待解析表格图像进行特征提取,得到视觉特征;对所述视觉特征和位置编码进行编码,得到编码特征;对所述目标编码特征进行解码,得到解析结果;

17、表格处理单元,用于根据每个所述单元格的位置和每个所述单元格的类别确定表格结构。

18、第五方面,本申请实施例提供了一种计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面的表格解析模型的训练方法的步骤,或者实现第二方面的表格解析方法的步骤。

19、第六方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面的表格解析模型的训练方法的步骤,或者实现第二方面的表格解析方法的步骤。

20、第七方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面的表格解析模型的训练方法的步骤,或者实现第二方面的表格解析方法的步骤。

本文档来自技高网...

【技术保护点】

1.一种表格解析模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述预测结果和所述标注信息确定目标损失,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据每个所述单元格的预测位置和预测类别,以及每个所述单元格的标注位置和标注类别,确定匹配损失,包括:

4.根据权利要求2所述的方法,其特征在于,所述标注连接关系包括标注连接关系矩阵;所述预测连接关系包括预测连接关系矩阵;

5.根据权利要求1所述的方法,其特征在于,所述对所述样本视觉特征和位置编码进行编码,包括:

6.根据权利要求5所述的方法,其特征在于,所述表格解析模型包括解码层和全连接层;

7.一种表格解析方法,其特征在于,所述方法包括:

8.一种表格解析模型的训练装置,其特征在于,所述装置包括:

9.一种表格解析装置,其特征在于,所述装置包括:

10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的表格解析模型的训练方法的步骤,或者实现权利要求7所述的表格解析方法的步骤。

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的表格解析模型的训练方法的步骤,或者实现权利要求7所述的表格解析方法的步骤。

...

【技术特征摘要】

1.一种表格解析模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述预测结果和所述标注信息确定目标损失,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据每个所述单元格的预测位置和预测类别,以及每个所述单元格的标注位置和标注类别,确定匹配损失,包括:

4.根据权利要求2所述的方法,其特征在于,所述标注连接关系包括标注连接关系矩阵;所述预测连接关系包括预测连接关系矩阵;

5.根据权利要求1所述的方法,其特征在于,所述对所述样本视觉特征和位置编码进行编码,包括:

6.根据权利要求5所述的方法,其特征在于,所述表格解析模型包括解码层和全连接...

【专利技术属性】
技术研发人员:王雷陆全夏粉周迅溢蒋宁吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1