结合RPA和AI的表格生成方法及装置、计算设备、存储介质制造方法及图纸

技术编号:26032730 阅读:19 留言:0更新日期:2020-10-23 21:10
本说明书实施例公开一种结合RPA和AI的表格生成方法及装置、计算设备、存储介质。该方法包括:S1:获取表格识别结果的表格数据;S2:根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;S3:根据所述单元格的行列位置以及对应的单元格中的内容数据,生成可编辑表格文件。

【技术实现步骤摘要】
结合RPA和AI的表格生成方法及装置、计算设备、存储介质
本说明书涉及RPA领域,具体而言,涉及一种结合RPA和AI的表格生成方法及装置、计算设备、存储介质。
技术介绍
机器人流程自动化(RoboticProcessAutomation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。人工智能(ArtificialIntelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。RPA的具有独特的优势:低代码、非侵入。低代码是说,RPA不需要很高的IT水平就能操作,不懂编程的业务人员也能开发流程;非侵入是说,RPA可以模拟人的操作,不用软件系统开放接口。但是传统的RPA具有一定的局限性:只能基于固定的规则,并且应用场景受限。随着AI(ArtificialIntelligence)技术的不断发展,RPA与AI深度融合克服了传统RPA的局限,RPA+AI=Handwork+Headwork,正在极大的改变劳动力的价值。目前表格识别主要通过OCR识别直接获取,但OCR识别的表格结果无法获取到原表格的格式,表格的行列会产生错乱,表格的内容发生改变,导致工作人员在后续使用到表格结果时,出现结果错误的问题。因此,为获取到原表格的表格内容以及表格格式,结合RPA和AI开发一种通过表格识别结果还原相同格式的可编辑表格文件的方法。
技术实现思路
本说明书实施例提供一种结合RPA和AI的表格生成方法及装置、计算设备、存储介质,用以克服现有技术中存在的至少一个技术问题。根据本说明书实施例的第一方面,提供一种结合RPA和AI的表格生成方法,包括:S1:获取表格识别结果的表格数据;S2:根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;S3:根据所述单元格的行列位置以及对应的单元格中的内容数据,生成可编辑表格文件。可选地,所述S1的具体步骤为:S11:基于OCR识别,获取所述表格识别结果;S12:从所述表格识别结果的数据格式中获取表格数组;其中,所述表格数组的一个元素代表一组表格数据,一组表格数据代表一个表格的数据。可选地,所述表格数据包括对应表格中每个单元格所属的开始行、结束行、开始列、结束列以及每个单元格中的内容数据,其中,单元格的行列没有对齐就会被识别成单独的行列,所述S2的具体步骤为:S21:将所述表格数据中的最小开始列和最大结束列进行对比,得到所述表格数据对应的表格的列数;S22:将所述表格数据中的最小开始行和最大结束行进行对比,得到所述表格数据对应的表格的行数;S23:将所述表格数据中的每个单元格的开始行和结束行进行对比,得到每个所述单元格的所属行;其中,所述单元格所属一行或跨越多行;S24:将所述表格数据中的每个单元格的开始列和结束列进行对比,得到每个所述单元格的所属列;其中,所述单元格所属一列或跨越多列。可选地,所述S3的具体步骤为:S31:根据每个所述单元格的所属行,确定所属同一行的单元格;其中,所属一行的单元格与跨越多行的单元格中的其中一行相同,确定两者所属同一行;S32:根据所述所属同一行的单元格,获取该行单元格中每一单元格的所属列,并对应生成该行表格;S33:记录该行单元格中每一单元格的所属列,当该行单元格中每一单元格的所属列的总和等于所述表格数据对应的表格的列数时,切换到该行单元格的下一行,继续生成下一行的表格;S34:记录每行单元格的所属行,当每行单元格的所属行的总和等于所述表格数据对应的表格的行数时,生成整体表格;S35:将跨越多行的单元格中的子单元格进行单元合并,得到对应的单元格,生成完整的表格;S36:根据每个所述单元格的所属行和所属列,将所述单元格对应的内容数据填入所述完整的表格中,得到所述可编辑表格文件。根据本说明书实施例的第一方面,提供一种结合RPA和AI的表格生成装置,包括:数据模块,被配置为获取表格识别结果的表格数据;位置模块,被配置为根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;表格模块,被配置为根据所述单元格的行列位置以及对应的单元格中的内容数据,生成可编辑表格文件。可选地,所述数据模块包括:识别单元,被配置为基于OCR识别,获取所述表格识别结果;数据单元,被配置为从所述表格识别结果的数据格式中获取表格数组;其中,所述表格数组的一个元素代表一组表格数据,一组表格数据代表一个表格的数据。可选地,所述表格数据包括对应表格中每个单元格所属的开始行、结束行、开始列、结束列以及每个单元格中的内容数据,其中,单元格的行列没有对齐就会被识别成单独的行列,所述位置模块包括:列数单元,被配置为将所述表格数据中的最小开始列和最大结束列进行对比,得到所述表格数据对应的表格的列数;行数单元,被配置为将所述表格数据中的最小开始行和最大结束行进行对比,得到所述表格数据对应的表格的行数;所属列单元,被配置为将所述表格数据中的每个单元格的开始列和结束列进行对比,得到每个所述单元格的所属列;其中,所述单元格所属一列或跨越多列;所属行单元,被配置为将所述表格数据中的每个单元格的开始行和结束行进行对比,得到每个所述单元格的所属行;其中,所述单元格所属一行或跨越多行。可选地,所述表格模块包括:确定单元,被配置为根据每个所述单元格的所属行,确定所属同一行的单元格;其中,所属一行的单元格与跨越多行的单元格中的其中一行相同,确定两者所属同一行;生成单元,被配置为根据所述所属同一行的单元格,获取该行单元格中每一单元格的所属列,并对应生成该行表格;第一记录单元,被配置为记录该行单元格中每一单元格的所属列,当该行单元格中每一单元格的所属列的总和等于所述表格数据对应的表格的列数时,切换到该行单元格的下一行,继续生成下一行的表格;第二记录单元,被配置为记录每行单元格的所属行,当每行单元格的所属行的总和等于所述表格数据对应的表格的行数时,生成整体表格;合并单元,被配置为将跨越多行的单元格中的子单元格进行单元合并,得到对应的单元格,生成完整的表格;表格单元,被配置为根据每个所述单元格的所属行和所属列,将所述单元格对应的内容数据填入所述完整的表格中,得到所述可编辑表格文件。根据本说明书实施例的第三方面,提供一种计算设备,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述计算设备执行时实现所述结合RPA和AI的表格生成方法的步骤。根据本说明书实施例的第四方面,提供一种存储介质,其存储有上述计算设备中所使用的计算机程序,该计算机程序被处理器执行时实现所述结合RPA和AI的表格生成方法的步骤。本说明书实施例的有益效果如下:本方法通过OCR识别获取表格识别结本文档来自技高网...

【技术保护点】
1.一种结合RPA和AI的表格生成方法,其特征在于,包括:/nS1:获取表格识别结果的表格数据;/nS2:根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;/nS3:根据所述单元格的行列位置以及对应的单元格中的内容数据,生成可编辑表格文件。/n

【技术特征摘要】
1.一种结合RPA和AI的表格生成方法,其特征在于,包括:
S1:获取表格识别结果的表格数据;
S2:根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;
S3:根据所述单元格的行列位置以及对应的单元格中的内容数据,生成可编辑表格文件。


2.根据权利要求1所述的方法,其特征在于,所述S1的具体步骤为:
S11:基于OCR识别,获取所述表格识别结果;
S12:从所述表格识别结果的数据格式中获取表格数组;其中,所述表格数组的一个元素代表一组表格数据,一组表格数据代表一个表格的数据。


3.根据权利要求2所述的方法,其特征在于,所述表格数据包括对应表格中每个单元格所属的开始行、结束行、开始列、结束列以及每个单元格中的内容数据,其中,单元格的行列没有对齐就会被识别成单独的行列,所述S2的具体步骤为:
S21:将所述表格数据中的最小开始列和最大结束列进行对比,得到所述表格数据对应的表格的列数;
S22:将所述表格数据中的最小开始行和最大结束行进行对比,得到所述表格数据对应的表格的行数;
S23:将所述表格数据中的每个单元格的开始行和结束行进行对比,得到每个所述单元格的所属行;其中,所述单元格所属一行或跨越多行;
S24:将所述表格数据中的每个单元格的开始列和结束列进行对比,得到每个所述单元格的所属列;其中,所述单元格所属一列或跨越多列。


4.根据权利要求3所述的方法,其特征在于,所述S3的具体步骤为:
S31:根据每个所述单元格的所属行,确定所属同一行的单元格;其中,所属一行的单元格与跨越多行的单元格中的其中一行相同,确定两者所属同一行;
S32:根据所述所属同一行的单元格,获取该行单元格中每一单元格的所属列,并对应生成该行表格;
S33:记录该行单元格中每一单元格的所属列,当该行单元格中每一单元格的所属列的总和等于所述表格数据对应的表格的列数时,切换到该行单元格的下一行,继续生成下一行的表格;
S34:记录每行单元格的所属行,当每行单元格的所属行的总和等于所述表格数据对应的表格的行数时,生成整体表格;
S35:将跨越多行的单元格中的子单元格进行单元合并,得到对应的单元格,生成完整的表格;
S36:根据每个所述单元格的所属行和所属列,将所述单元格对应的内容数据填入所述完整的表格中,得到所述可编辑表格文件。


5.一种结合RPA和AI的表格生成装置,其特征在于,包括:
数据模块,被配置为获取表格识别结果的表格数据;
位置模块,被配置为根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;
表格模块,被配置为根据所述单元格的行列位置以及对...

【专利技术属性】
技术研发人员:汪冠春胡一川刘晨阳
申请(专利权)人:北京来也网络科技有限公司北京奔影网络科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1