System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大模型和自定制需求模板的RPA流程自动化生成方法技术_技高网

基于大模型和自定制需求模板的RPA流程自动化生成方法技术

技术编号:40577456 阅读:6 留言:0更新日期:2024-03-06 17:19
本发明专利技术公开了一种基于大模型和自定制需求模板的RPA流程自动化生成方法,包括如下步骤:基于人机协同标注方式,对文档解析大模型和代码生成大模型进行训练;之后,利用训练好的文档解析大模型,进行自定制需求模板生成;再基于自定制需求模板和已训练的代码生成大模型,进行RPA代码生成;最后,基于生成的RPA代码,使用RPA设计器对所生成的代码进行编译,从而实现组件组的自动化生成。本发明专利技术方案通过对于大模型的有效利用,解决现有RPA组件化自动生成过程中所存在的组件操作流程图生成不准确、适用范围狭窄、难以产生高匹配的RPA组件执行代码等问题,有效的减轻了人为工作量。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及一种基于大模型和自定制需求模板的rpa流程自动化生成方法。


技术介绍

1、随着数字化时代的到来,rpa(rpa为robotic process automation,机器人流程自动化)技术被广泛应用各行各业中,极大的提高企业的业务处理速度。但rpa的局限性在于它们需要人工的去定义的自动化操作规则,并且无法处理复杂或非结构化的数据。

2、近年,人工智能生产内容aigc(aigc:artificial intelligence generatedcontent,人工智能生产内容)颠覆行业对于ai(artificial intelligence,人工智能)的认知,aigc可以很好的将上传文档中的需求内容进行需求流程图构建,并根据流程图自动生成相关指令代码。因此,将大模型与rpa机器人融合成为当前科研机构和企业的主流研究方向,能有效帮助rpa机器人处理更复杂任务。

3、目前,使用ai+rpa机器人解决类似问题的方案有:

4、方案1:通过使用bert-base模型(bert-base:bidirectional encoderrepresentations from transformers-base基于transformer的双向编码特征表示模型)对转换成流程块字典的需求文档进行词嵌入,并使用allennlp对词嵌入完成流程块字典块进行流程关系处理和逻辑关系合并,从而生成所需的操作流程图,最后使用第三方工具对生成的流程图进行代码转换。

5、方案2:通过统计业务场景中各类功能组件的使用关系,得到各个功能组件到其他组件的转移概率,并以转移概率为依据为rpa创建流程的每一步进行组件推荐,从而实现流程自动化。

6、但是,上述方案存在以下问题:

7、问题1:首先,方案1主要是基于bert模型将需求文档的内容进行字典块转换,这种仅依靠于模型语义特性进行字典块生成方法很容易造成字典块中核心流程步骤的缺失和无关内容的加入,进而造成后续组件操作流程图的错误,其次,使用第三方软件生成的对应流程图执行代码并不能很好的与rpa机器人适配,容易出现执行异常。

8、问题2:方案2中,通过对组件转移概率模型的构建,为每一步rpa流程推荐下一步组件,从而实现流程自动化。这种方法理论上可行,但只能适用一些简单的、步骤单一的rpa场景,若想应用于复杂的rpa项目中,需要大量的流程数据和关系数据提供给概率模型进行训练,时间成本和人力成本较高。其次,对于rpa常见的列表组件,简单依靠概率推荐将出现问题,比如点击员工类型列表按钮,该按钮包含研发人员、项目主管、后勤人员三个选择,这对于概率模型来说是均等概率,无法进行准确推荐。最后,方案2只是简单进行组件推荐,并没有自动生成rpa代码进行组件定位,使得所推荐的组件仍需人工进行网页元素定位。因此该专利技术在实际应用中使用范围较窄,实用性较差。

9、因此,亟需一种基于大模型和自定制需求模板的rpa流程自动化生成方法,来解决上述问题。


技术实现思路

1、本专利技术针对现有技术中的不足,提供一种基于大模型和自定制需求模板的rpa流程自动化生成方法,以解决现有rpa组件化自动生成过程中所存在的组件操作流程图生成不准确、适用范围狭窄、难以产生高匹配的rpa组件执行代码的问题。

2、为实现上述目的,本专利技术采用以下技术方案:

3、一种基于大模型和自定制需求模板的rpa流程自动化生成方法,其特征在于,包括如下步骤:基于人机协同标注方式,对文档解析大模型和代码生成大模型进行训练;之后,利用训练好的文档解析大模型,进行自定制需求模板生成;再基于自定制需求模板和已训练的代码生成大模型,进行rpa代码生成;最后,基于生成的rpa代码,使用rpa设计器对所生成的代码进行编译,从而实现组件组的自动化生成。

4、为优化上述技术方案,采取的具体措施还包括:

5、进一步地,所述文档解析大模型的训练,包括如下步骤:

6、步骤1.1、收集需求文档作为原文档,同时人工的将所收集需求文档中涉及具体流程操作的部分加上对应的网页链接,构成需求文档格式;

7、步骤1.2、随机选择需求文档中的40%进行人工内容抽取和标签标注,生成人工标注数据集dn=(an,qn);并按照9:1的划分方式划分训练集dn1和测试集dn2,其中n为数据集总数,qn为dn的文档内容集,an为dn的回答结果集,n1、n2分别为训练集和测试集的数量,且n1+n2=n;

8、步骤1.3、将dn1送入文档解析大模型中进行初次微调;

9、步骤1.4、使用文档拼接和随机掩码方式对剩下的60%需求文档进行数据增强,并利用ocr算法对数据增强后的需求文档进行内容提取,并将提取到的文本输入到微调后的文档解析大模型进行解析;以文档内容为问题,文档解析大模型的回答为结果,生成机器标注数据集其中v为数据集总数,为文档内容集,为回答结果集;

10、步骤1.5、将dn1和结合起来构成新的数据集输入到文档解析大模型中进行再次微调;使用测试集dn2对再次微调的文档解析大模型进行测试,若模型回答准确度达到80%以上,则完成模型训练,获得最终的文档解析大模型;否则,以当前训练模型作为最新的微调模型返回步骤1.4。

11、进一步地,所述代码生成大模型的训练,包括如下步骤:

12、步骤2.1、基于数据集dn中回答结果集an={a1,a2,…,ai,…,an},人工的使用网页源码提取器进行对应的流程源码提取,生成对应源码集on={o1,o2,…,oi,…,on},使用rpa设计器生成对应rpa代码集cn={c1,c2,…,ci,…,cn};其中i为索引值,范围在[1,n]之间,ai、oi、ci分别表示第i条回答结果、网页源码、rpa代码;

13、步骤2.2、以an和on的整合内容作为问题集cn作为大模型的回答结果集构成代码生成大模型人工标注数据集bn=(qc,ac)n;同理按照9:1的划分方式划分训练集bn1和测试集bn2;

14、步骤2.3、将bn1送入代码生成大模型中进行初次微调;

15、步骤2.4、基于an、on和进行代码生成大模型机器标注集的构建;

16、步骤2.5、将bn1和结合起来构成新的数据集输入到代码生成大模型中进行再次微调;使用测试集bn2对再次微调的大模型进行测试,若大模型回答准确度达到80%以上,则完成模型训练,获得最终的代码生成大模型;否则,以当前训练模型作为最新的微调模型返回步骤2.4。

17、进一步地,所述基于an、on和进行代码生成大模型机器标注集的构建,具体步骤如下:

18、步骤2.4.1、建立一个空的机器标注源码集合

19、步骤2.4.2、将中每条回答结果都与an中的所有回答结果进行流程相似度计算,获得流程相似度结果矩阵具体的计算结果如下:

20、

本文档来自技高网...

【技术保护点】

1.一种基于大模型和自定制需求模板的RPA流程自动化生成方法,其特征在于,包括如下步骤:基于人机协同标注方式,对文档解析大模型和代码生成大模型进行训练;之后,利用训练好的文档解析大模型,进行自定制需求模板生成;再基于自定制需求模板和已训练的代码生成大模型,进行RPA代码生成;最后,基于生成的RPA代码,使用RPA设计器对所生成的代码进行编译,从而实现组件组的自动化生成。

2.根据权利要求1所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法,其特征在于,所述文档解析大模型的训练,包括如下步骤:

3.根据权利要求2所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法,其特征在于,所述代码生成大模型的训练,包括如下步骤:

4.根据权利要求3所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法,其特征在于,所述基于aN、oN和进行代码生成大模型机器标注集的构建,具体步骤如下:

5.根据权利要求1所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法,其特征在于,所述利用训练好的文档解析大模型,进行自定制需求模板生成;再基于自定制需求模板和已训练的代码生成大模型,进行RPA代码生成,具体步骤如下:

6.根据权利要求5所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法,其特征在于,所述自定制需求模板,具体步骤如下:

7.根据权利要求6所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法,其特征在于,所述基于RPA操作流程图中网页链接和具体的操作步骤描述,使用网页源码解析器进行对应网页源码提取,具体步骤如下:

8.根据权利要求1所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法,其特征在于,所述基于生成的RPA代码,使用RPA设计器对所生成的代码进行编译,从而实现组件组的自动化生成,具体步骤如下:

9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序使计算机执行如权利要求1-8任一项所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法。

10.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行计算机程序时,实现如权利要求1-8任一项所述的一种基于大模型和自定制需求模板的RPA流程自动化生成方法。

...

【技术特征摘要】

1.一种基于大模型和自定制需求模板的rpa流程自动化生成方法,其特征在于,包括如下步骤:基于人机协同标注方式,对文档解析大模型和代码生成大模型进行训练;之后,利用训练好的文档解析大模型,进行自定制需求模板生成;再基于自定制需求模板和已训练的代码生成大模型,进行rpa代码生成;最后,基于生成的rpa代码,使用rpa设计器对所生成的代码进行编译,从而实现组件组的自动化生成。

2.根据权利要求1所述的一种基于大模型和自定制需求模板的rpa流程自动化生成方法,其特征在于,所述文档解析大模型的训练,包括如下步骤:

3.根据权利要求2所述的一种基于大模型和自定制需求模板的rpa流程自动化生成方法,其特征在于,所述代码生成大模型的训练,包括如下步骤:

4.根据权利要求3所述的一种基于大模型和自定制需求模板的rpa流程自动化生成方法,其特征在于,所述基于an、on和进行代码生成大模型机器标注集的构建,具体步骤如下:

5.根据权利要求1所述的一种基于大模型和自定制需求模板的rpa流程自动化生成方法,其特征在于,所述利用训练好的文档解析大模型,进行自定制需求模板生成;再基于自定制需求模板和已训练的代...

【专利技术属性】
技术研发人员:马博文糜俊奚阳陈郑
申请(专利权)人:中电鸿信信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1