【技术实现步骤摘要】
一种基于RPA的Excel文档智能填报系统及其方法
本专利技术涉及智能数据处理
,尤其涉及一种基于RPA的Excel文档智能填报系统及其方法。
技术介绍
机器人流程自动化RPA(Roboticprocessautomation)是以软件机器人为基础的业务过程自动化处理软件。该技术可以模拟人类的行为,将现有的手动任务或流程进行自动化操作,能够大大提高工作效率。RPA技术在电商、税务、银行、制造业、新零售、保险、物流、政府、公安等行业具有广泛的应用前景。Excel表格的填报已广泛应用于数据填报、材料评审、材料审核、信息抽取、资料整理、文档归档等工作场景。例如,每个月从考勤系统的数据库中读取企业员工的考勤数据,然后根据这些数据填报到指定Excel的考勤记录表。这些工作的特点是业务处理流程基本固定,需要填报的Excel表格的格式也基本不变,但需要填写的数据经常变化,繁琐的、重复的Excel手工操作增加了工作强度和人为出错的机会。
技术实现思路
本专利技术的目的在于克服现有技术中的不足,提供一种基于R ...
【技术保护点】
1.一种基于RPA的Excel文档智能填报方法,其特征在于,包括如下步骤:/n基于待填报原始Excel文档的表格表头信息,将获取的原始数据转换为CSV格式的原始数据集;/n将原始数据集转换成YML格式的临时数据集,所述临时数据集的配置参数包括sheetName,tableType,parentHead和tableData,所述sheetName用于存储待填报原始Excel文档的工作表名称,所述tableType用于存储工作表中表格填报类型,所述parentHead用于存储表格的父表头名称,所述tableData用于存储与所述父表头的子表头相对应原始数据集的字段数据;/n利用 ...
【技术特征摘要】
1.一种基于RPA的Excel文档智能填报方法,其特征在于,包括如下步骤:
基于待填报原始Excel文档的表格表头信息,将获取的原始数据转换为CSV格式的原始数据集;
将原始数据集转换成YML格式的临时数据集,所述临时数据集的配置参数包括sheetName,tableType,parentHead和tableData,所述sheetName用于存储待填报原始Excel文档的工作表名称,所述tableType用于存储工作表中表格填报类型,所述parentHead用于存储表格的父表头名称,所述tableData用于存储与所述父表头的子表头相对应原始数据集的字段数据;
利用虚拟DOM算法对待填报原始Excel文档进行解析,生成包含原始Excel文档表格的父表头、子表头及位置关系的虚拟DOM结构;
基于所述虚拟DOM结构确定所述tableData中字段数据填报的起始位置,并按照所述tableType的填报类型填报到原始Excel文档的指定表格中。
2.根据权利要求1所述基于RPA的Excel文档智能填报方法,其特征在于,还包括获取待填报的原始数据,原始数据的获取方法包括从数据库、消息队列、日志文档或配置文档中采集指定数据。
3.根据权利要求1所述基于RPA的Excel文档智能填报方法,其特征在于,原始数据集的CSV格式表示为:
c1,c2,…,cN
v11,v12,…,v1N
v21,v22,…,v2N
……
vM1,vM2,…,vMN
其中,[c1,c2,…,cN]为CVS格式数据的N个字段名称集合,[v11,v12,…,v1N]为第1条数据记录,[v21,v22,…,v2N]为第2条数据记录,[vM1,vM2,…,vMN]为第M条数据记录。
4.根据权利要求3所述基于RPA的Excel文档智能填报方法,其特征在于,YML模板文档的格式如下所示:
sheetName:工作表名称
tableType:“colum/row”
parentHead:[父表头名称列表]
tableMap:
-c1:w1
-c2:w2
……
-cN:wN
其中,sheetName表示原始Excel文档中的工作表名称,tableType表示Excel表格的填报类型,parentHead表示Excel表格中父表头名称列表,[w1,w2,…,wN]为Excel表格中子表头名称列表。
5.根据权利要求4所述基于RPA的Excel文档智能填报方法,其特征在于,所述临时数据集的格式如下表示:
sheetName:工作表名称
tableType:“colum/row”
parentHead:[父表头名称列表]
tableData:
-w1:[v11,v21,...,vM1]
-w2:[v12,v22,...,vM2]
-wN:[v1N,v2N,...,vMN]
其中,[w1,w2,…,wN]为Excel表格中子表头名称列表。
6.根据权利要求5所述基于RPA的Excel文档智能填报方法,其特征在于,将原始数据集转换成YML格式的临时数据集的方法包括如下步骤:
读取YML模板文档并解析获得YML模板文档的sheetName、tableType、parentHead和tableMap配置参数;
读取原始数据集并解析获得原始数据集的字段名称集合[c1,c2,…,cN]和对应的所有数据记录;
依次遍历所有数据记录,对每一条数据记录[vM1,vM2,…,vMN]进行解析,将每一条数据记录中的每一个元素与字段名称集合[c1,c2,…,cN]中对应的元素建立对...
【专利技术属性】
技术研发人员:董志勇,李方方,乔洁,
申请(专利权)人:南京信息职业技术学院,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。