【技术实现步骤摘要】
结合RPA和AI的表格生成方法及装置、计算设备、存储介质
本说明书涉及RPA领域,具体而言,涉及一种结合RPA和AI的表格生成方法及装置、计算设备、存储介质。
技术介绍
机器人流程自动化(RoboticProcessAutomation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。人工智能(ArtificialIntelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。RPA的具有独特的优势:低代码、非侵入。低代码是说,RPA不需要很高的IT水平就能操作,不懂编程的业务人员也能开发流程;非侵入是说,RPA可以模拟人的操作,不用软件系统开放接口。但是传统的RPA具有一定的局限性:只能基于固定的规则,并且应用场景受限。随着AI(ArtificialIntelligence)技术的不断发展,RPA与AI深度融合克服了传统RPA的局限,RPA+AI=Handwork+Headwork,正在极大的改变劳动力的价值。目前表格识别主要通过OCR识别直接获取,但OCR识别的表格结果无法获取到原表格的格式,表格的行列会产生错乱,表格的内容发生改变,导致工作人员在后续使用到表格结果时,出现结果错误的问题。因此,为获取到原表格的表格内容以及表格格式,结合RPA和AI开发一种通过表格识别结果还原相同格式的可编辑表格文件的方法。
技术实现思路
本说明书实施例提供一种结合RPA和AI的表格生成方 ...
【技术保护点】
1.一种结合RPA和AI的表格生成方法,其特征在于,包括:/nS1:获取表格识别结果的表格数据;/nS2:根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;/nS3:根据所述单元格的行列位置以及对应的单元格中的内容数据,生成可编辑表格文件。/n
【技术特征摘要】
1.一种结合RPA和AI的表格生成方法,其特征在于,包括:
S1:获取表格识别结果的表格数据;
S2:根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;
S3:根据所述单元格的行列位置以及对应的单元格中的内容数据,生成可编辑表格文件。
2.根据权利要求1所述的方法,其特征在于,所述S1的具体步骤为:
S11:基于OCR识别,获取所述表格识别结果;
S12:从所述表格识别结果的数据格式中获取表格数组;其中,所述表格数组的一个元素代表一组表格数据,一组表格数据代表一个表格的数据。
3.根据权利要求2所述的方法,其特征在于,所述表格数据包括对应表格中每个单元格所属的开始行、结束行、开始列、结束列以及每个单元格中的内容数据,其中,单元格的行列没有对齐就会被识别成单独的行列,所述S2的具体步骤为:
S21:将所述表格数据中的最小开始列和最大结束列进行对比,得到所述表格数据对应的表格的列数;
S22:将所述表格数据中的最小开始行和最大结束行进行对比,得到所述表格数据对应的表格的行数;
S23:将所述表格数据中的每个单元格的开始行和结束行进行对比,得到每个所述单元格的所属行;其中,所述单元格所属一行或跨越多行;
S24:将所述表格数据中的每个单元格的开始列和结束列进行对比,得到每个所述单元格的所属列;其中,所述单元格所属一列或跨越多列。
4.根据权利要求3所述的方法,其特征在于,所述S3的具体步骤为:
S31:根据每个所述单元格的所属行,确定所属同一行的单元格;其中,所属一行的单元格与跨越多行的单元格中的其中一行相同,确定两者所属同一行;
S32:根据所述所属同一行的单元格,获取该行单元格中每一单元格的所属列,并对应生成该行表格;
S33:记录该行单元格中每一单元格的所属列,当该行单元格中每一单元格的所属列的总和等于所述表格数据对应的表格的列数时,切换到该行单元格的下一行,继续生成下一行的表格;
S34:记录每行单元格的所属行,当每行单元格的所属行的总和等于所述表格数据对应的表格的行数时,生成整体表格;
S35:将跨越多行的单元格中的子单元格进行单元合并,得到对应的单元格,生成完整的表格;
S36:根据每个所述单元格的所属行和所属列,将所述单元格对应的内容数据填入所述完整的表格中,得到所述可编辑表格文件。
5.一种结合RPA和AI的表格生成装置,其特征在于,包括:
数据模块,被配置为获取表格识别结果的表格数据;
位置模块,被配置为根据所述表格数据,获取所述表格识别结果中每一单元格的行列位置;
表格模块,被配置为根据所述单元格的行列位置以及对...
【专利技术属性】
技术研发人员:汪冠春,胡一川,刘晨阳,
申请(专利权)人:北京来也网络科技有限公司,北京奔影网络科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。