【技术实现步骤摘要】
本专利技术涉及表格识别,尤其涉及一种基于gpt大模型的无线表格识别方法及系统。
技术介绍
1、随着电子信息的普及,大量的电子文档涌现出来,如何从这些文档中挖掘出有用的信息是信息时代的重中之重。在信息挖掘之前首先要面对的就是不同格式电子文件,比如html、doc、pdf、扫描件、图片等,其中图片、扫描件的信息挖掘尤其困难,由于其像素级编码格式,需要先通过计算机技术将像素编码翻译为类似latex、html等编码形式。在信息文档中,表格能尽可能清晰、简洁高效的表达,但是真实的文档中,表格的变化是多种多样的,尤其是无线表格部分,有大量的布局形式是基于人的共识形成的,很难形成固定的程式以代码的形式描述。
2、在处理此类的无线表格时,目前主要依赖大数据和单一模态信息,利用img2seg算法进行处理后输出类似html的格式。
3、然而,上述方式进行表格识别需要数据量比较大,而且一些先验的表格知识很难融入到模型中,如果数据稍有波动就会导致输出结果错误;此外,对于表格数据而言,标注成本比较高,由于模型过分依赖海量数据,以致算法成本
【技术保护点】
1.一种基于GPT大模型的无线表格识别方法,其特征在于,包括:
2.根据权利要求1所述的基于GPT大模型的无线表格识别方法,其特征在于,在根据所述各行文本的像素分布结果,利用GPT大模型进行断句预测之前,包括:
3.根据权利要求1所述的基于GPT大模型的无线表格识别方法,其特征在于,所述文本行裁切结果包括文本行、各行文本位于不同列的字符以及基于所述文本行和所述各行文本位于不同列的字符确定的文本框,在根据预测结果对所述文本行识别结果进行裁切,得到文本行裁切结果之后,包括:
4.根据权利要求1所述的基于GPT大模型的无线表格识别方法,其
...【技术特征摘要】
1.一种基于gpt大模型的无线表格识别方法,其特征在于,包括:
2.根据权利要求1所述的基于gpt大模型的无线表格识别方法,其特征在于,在根据所述各行文本的像素分布结果,利用gpt大模型进行断句预测之前,包括:
3.根据权利要求1所述的基于gpt大模型的无线表格识别方法,其特征在于,所述文本行裁切结果包括文本行、各行文本位于不同列的字符以及基于所述文本行和所述各行文本位于不同列的字符确定的文本框,在根据预测结果对所述文本行识别结果进行裁切,得到文本行裁切结果之后,包括:
4.根据权利要求1所述的基于gpt大模型的无线表格识别方法,其特征在于,在根据所述文本裁切结果,对所述第一表格进行拆分、合并和/或删除处理之后,包括:
5.根据权利要求1所述的基于gpt大模型的无线表格识别方法,其特征在于,在所述得到表格识别结...
【专利技术属性】
技术研发人员:李俊,郎凯,
申请(专利权)人:北京感易智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。