大模型智能体驱动的航空文档分析与测试用例生成系统技术方案

技术编号：41066652 阅读：3 留言：0更新日期：2024-04-24 11:21

本发明专利技术提供了大模型智能体驱动的航空文档分析与测试用例生成系统，包括原生文档知识化处理模块、指令分解模块、指令重用模块、记忆模块、规划模块、校验模块、执行模块、探索模块、本地知识库；所述原生文档知识化处理模块用于将含异质数据的航空数据原生文档进行知识化处理；所述指令分解模块用于，通过指令分解器，将用户输入的初始指令分解为一系列抽象的高层规划步骤或子目标，指导整个系统的运作流程；本发明专利技术基于智能决策框架和形式化模型的构建，能够更精确地符合实际需求和条件限制。这种方法与传统的静态决策过程相比，能够更灵活地适应不同设备、不同场景的测试用例生成任务。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人工智能与数据处理，尤其涉及大模型智能体驱动的航空文档分析与测试用例生成系统。

技术介绍

1、根据资料显示，目前国内外很多研究机构对航空软件测试标准都有专门的研究。2004年我国发布了gjb/z-2004《军用软件测试指南》，対国内有关航空软件测试提出了一套正式的官方标准。国外在1982年发布了一套标准，在修改后于1992年发布了do-178b标准，名为《机载系统和设备合格审定中的软件考虑》。do-178标准为航空软件的设计、开发、测试以及配置提供指导。在该标准中，与测试相关的理论主要是用验证定义软件测试，即验证包括评审、分析和测试三个部分。

2、评审主要分析软件系统是否满足设计需求说明书所规定的各项功能指标，提供定性的分析；分析是指对一个软件系统的功能、性能和安全性影响等内容进行分析，提供正确的可重复证据；测试一般就是指通过构造测试用例后运行被测软件程序以发现故障缺陷，除此之外，需要补充的有两点:第一点是证明软件满足它的需求，第二点是证明系统安全评估时审定的那些可能导致严重问题的缺陷已经被移除。

3、目前同类测试用例自动化技术主要面临的挑战是：一是软件需求规格说明复杂，形式化需求困难；二是要求测试用例对于软件的覆盖度尽可能高，去除冗余测试用例，保证测试用例的类型和数量；三是尽可能降低人力成本，提高测试用例生成方法的自动化和泛用性。最终目的是通过自动化测试发现航空软件系统中存在的缺陷。

4、关于形式化建模，最近工作使用xyz/e这种语言将边界值产生的测试数据进行时序逻辑的描述用以

5、曹爽使用基于kripke结构的时序模型的有限状态机来建模，同样存在需要人工分析软件需求规格说明书或仿真设备技术文档，然后手动建模，存在人力成本较高、迁移性不强的问题。张伟提出的自动生成测试用例框架在对输入参数添加约束和対生成的测试用例添加期望时，都需要手工去操作；并且対软件需求文档进行自动化分析时使用的是正则表达式，这限制了文档处理的灵活性，适用性不强。王文轩在论文中提出了“四变量理论模型”的形式化方法，构建包含事件、条件、模式、环境相互作用的环境，需要人工构建整个过程，自动化程度不高。

6、关于测试用例算法改进，主要目的是去除冗余测试用例，保证测试用例的类型和数量。郑超群针对其局部收敛和早熟现象，优化了适应度函数和交叉变异算法。这种方式在进化后期仍能保留一定的交叉与变异能力，与标准遗传算法相比收敛速度更快。高雪笛采用模拟退火的方法对选择、变异、遗传等算法进行优化改进。新个体的接受概率由metropolis准则函数得出，这样就能达到在搜索后期仍具有全局最优性。他们的工作都主要集中在改进测试用例算法本身，并没有关注测试用例执行结果带来的持续反馈，没有强化测试用例算法的针对性搜索功能。

技术实现思路

1、专利技术目的：针对软件需求规格或仿真设备技术文档说明含异质数据、说明复杂导致需要耗费大量人力和时间进行形式化建模的问题，本专利技术提供了一种大模型智能体驱动的文档分析与测试用例生成系统，这里的智能体是指大模型在特定指令下，模仿人类的决策过程来充当核心协调者，它使用自然语言处理、检索、多模态问答等技术提高了测试用例生成的自动化程度；针对以往测试用例建模场景难以泛化的问题，本专利技术提供了一种将新测试用例任务的自然语言指令，借助已执行轨迹作为测试用例生成示例并提取通用测试经验，自主转换为新的高低层规划的方法，该方法対节点集合进行排列组合，快速变换到不同测试场景的有限状态图；针对传统测试用例生成算法没有强化针对性搜索的问题，本专利技术提供了在遗传算法生成过程中根据反馈实时调整算子权重的方法。

2、本专利技术系统包括原生文档知识化处理模块、指令分解模块、指令重用模块、记忆模块、规划模块、校验模块、执行模块、探索模块、本地知识库；

3、所述原生文档知识化处理模块用于将含异质数据(表格、文本、图片)的航空数据原生文档进行知识化处理；

4、所述指令分解模块用于，通过指令分解器，将用户输入的初始指令分解为一系列抽象的高层规划步骤或子目标，指导整个系统的运作流程。这些高层步骤与常识推理密切相关，例如在航空测试用例场景涉及的常识是：“发送数据”之前通常需要“读取数据”，然后是“处理数据”；“选择表格中的行列单元格”之前需要需要“检索到相关表格”。目前大型语言模型已经被证明掌握了大量的常识性知识，且已有工作利用大型语言模型作为零样本规划器，这意味着它们可能具备自主规划的能力，能够在最小的人为干预下，有效地担任智能体系统中的高级规划者。指令分解模块利用思维链、上下文学习、实时反馈等技巧来有效地激活和利用这种自主规划能力。

5、所述指令重用模块用于收集经验、从经验中提取宏观规律、推理评估；

6、所述规划模块用于产生低层计划，负责具体执行时的规划；

7、所述校验模块用于调整高层规划步骤，反馈错误原因给规划模块，帮助规划模块重新执行当前步骤；

8、所述执行模块用于提供工具树；

9、所述记忆模块用于收集每个子智能体(sub agent)类型工具的交互过程作为历史交互记录，为长窗口对话提供条件；还用于指令复用，收集成功执行的工具链交互轨迹，当面临类似的新场景时，将成功执行的工具链交互轨迹作为示例或者根据实际上下文进行调整；所述记忆模块收集的交互过程也是实际的运行场景，是满足agent tuning训练数据格式的天然标记数据；

10、所述记忆模块还用于提供缓存机制，缓存每个工具出的中间结果；使用当前工具位置所在的工具链路径涉及的各个工具名组成的字符串作为一层键，当前工具的输入的哈希值作为二层键，将工具输入作为识别同一工具的不同运行；

11、所述记忆模块还用于测试用例维护与管理：当生成测试用例时，就将测试用例对应依据、生成过程、组成成分、最终测试用例联系在一起；

12、所述探索模块用于，根据飞行测试仪器的反馈，如果输入的某测试用例使得飞行测试仪器显式本次测试不通过，且本专利技术生成的测试用例不存在异常，那么本测试用例中的组成成分，例如已采样的变量参数和模拟的故障列表是待搜索的重点方向，通过在遗传算法等现有搜索算法中赋予这些变量参数和故障列表更大的权重，这样的实时反馈改进了遗传算法容易陷入局部最优，从而缓解了遗传算法容易忽略实际故障的问题。

13、所述原生文档知识化处理模块用于将航空数据原生文档进行知识化处理，具体包括：

14、将使用python-docx库対docx文档进行初次解析并遍历：

15、对于标题，维护一个元素为各级标题的栈结构，将格式为<文件名>-<一级标题>-<二级标题>..-<n级标题>的元信息关联到文本、图片和表格；

16、对于文本，按特殊标题为单位收集段落，同一最近本文档来自技高网...

【技术保护点】

1.大模型智能体驱动的航空文档分析与测试用例生成系统，其特征在于，包括原生文档知识化处理模块、指令分解模块、指令重用模块、记忆模块、规划模块、校验模块、执行模块、探索模块、本地知识库；

2.根据权利要求1所述的系统，其特征在于，所述原生文档知识化处理模块用于将航空数据原生文档进行知识化处理，具体包括：

3.根据权利要求2所述的系统，其特征在于，在本地知识库需要检索时，将查询编码到同一文本向量空间，计算查询向量与候选文本块向量之间的相似性度量，取前K个候选文本块进行召回：进行混合检索，将向量查询和基于关键词的查询进行结合，计算综合得分；通过元数据过滤限制搜索范围；进行重排校验。

4.根据权利要求3所述的系统，其特征在于，所述指令分解模块将指令分解器的运行过程描述为将初始指令I0分解为高层计划Ih＝[g0，g1，…，gT]，其中每个子目标gi是指通过高层动作得到某种资源或数据集合，i取值为0～T，T是获取所有资源或数据集合的总时间步数；其中高层动作是由下文中介绍的低层规划步骤的集合。

5.根据权利要求4所述的系统，其特征在于，当用户输入

6.根据权利要求5所述的系统，其特征在于，所述规划模块利用大型语言模型产生底层计划，将每个子目标映射为一系列更为细粒度的计划Il＝[a0，a1，…，aT]，其中Il表示底层指令，aT表示某时间步下执行的指令动作。

7.根据权利要求6所述的系统，其特征在于，所述工具树的节点包括四种类型：子智能体Sub Agent、管道Pipeline、组件Component、可调用函数Callable Function；

8.根据权利要求7所述的系统，其特征在于，所述本地知识库中存储有将航空系统测试的历史数据和专家知识，所述系统使用航空系统测试的历史数据和专家知识来指导遗传算法。

9.根据权利要求8所述的系统，其特征在于，系统实时监控仿真设备的反馈验证信息，其中仿真设备是用于模拟航空真实运行环境的软硬件设施，具体包括：

10.根据权利要求9所述的系统，其特征在于，所述指令重用模块用于收集经验、从经验中学习并提取宏观经验、推理生成系统未见过的测试用例并评估，具体包括：

...

【技术特征摘要】

2.根据权利要求1所述的系统，其特征在于，所述原生文档知识化处理模块用于将航空数据原生文档进行知识化处理，具体包括：

3.根据权利要求2所述的系统，其特征在于，在本地知识库需要检索时，将查询编码到同一文本向量空间，计算查询向量与候选文本块向量之间的相似性度量，取前k个候选文本块进行召回：进行混合检索，将向量查询和基于关键词的查询进行结合，计算综合得分；通过元数据过滤限制搜索范围；进行重排校验。

4.根据权利要求3所述的系统，其特征在于，所述指令分解模块将指令分解器的运行过程描述为将初始指令i0分解为高层计划ih＝[g0，g1，…，gt]，其中每个子目标gi是指通过高层动作得到某种资源或数据集合，i取值为0～t，t是获取所有资源或数据集合的总时间步数；其中高层动作是由下文中介绍的低层规划步骤的集合。

5.根据权利要求4所述的系统，其特征在于，当用户输入查询指令时，所述指令分解模块从航空行业测试者的角度将所述查询指令分解为生成测试用例的宏观步骤，包...

【专利技术属性】
技术研发人员：黄书剑，张我豪，戴新宇，陈家骏，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人