网络设备配置查询方法、装置、终端设备以及存储介质制造方法及图纸

技术编号：40406477 阅读：5 留言：0更新日期：2024-02-20 22:28

本发明专利技术公开了一种网络设备配置查询方法、装置、终端设备以及存储介质，涉及语言模型构建训练技术领域，其方法包括：获取用户输入的第一网络设备配置问题；将所述第一网络设备配置问题输入预先创建的网络设备配置问答模型，得到第一网络设备配置回答，所述网络设备配置问答模型是基于机器学习训练和微调优化得到。本发明专利技术能够降低配置网络设备的学习成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语言模型构建训练，尤其涉及一种网络设备配置查询方法、装置、终端设备以及存储介质。

技术介绍

1、网络设备是指用于建立、管理和维护计算机网络的硬件设备，例如路由器、交换机、防火墙等等，这些网络设备根据具体需求来提供特定的网络动能，不同的网络设备共同构建了一个完整的网络基础设备，以满足企业或个人的通信或数据传输需求。在使用网络设备之前需要对网络设备进行配置。

2、当前对网络设备进行配置，主要通过相关技术人员学习各个厂商的网络设备配置手册、操作指南和相关文档，了解每个厂商设备的命令语言、配置选项和操作流程，再根据具体网络环境和需求，手动输入配置命令或者通过特定的界面进行配置操作。然而，不同厂商在界面形式、操作逻辑流程、配置格式等方面都存在较大的差异，即使同一厂商的不同型号的网络设备配置都可能存在差异，从而使得配置网络设备的学习成本很高。

技术实现思路

1、本专利技术的主要目的在于提供一种网络设备配置查询方法、装置、终端设备以及存储介质，旨在解决目前配置网络设备的学习成本很高的问题。

2、为实现上述目的，本专利技术提供一种网络设备配置查询方法，所述方法包括：

3、获取用户输入的第一网络设备配置问题；

4、将所述第一网络设备配置问题输入预先创建的网络设备配置问答模型，得到第一网络设备配置回答，所述网络设备配置问答模型是基于机器学习训练和微调优化得到。

5、可选地，所述获取用户输入的第一网络设备配置问题的步骤之前包括：</p>

6、创建基于机器学习训练和微调优化的所述网络设备配置问答模型。

7、可选地，所述创建基于机器学习训练和微调优化的所述网络设备配置问答模型的步骤包括：

8、收集网络设备配置的相关数据；

9、基于所述网络设备配置的相关数据对预先获取的预训练模型进行语言模型监督微调训练，得到第一问答模型；

10、收集用户基于所述第一问答模型的反馈数据，所述反馈数据包含第一问答模型的缺陷；

11、基于所述缺陷对所述第一问答模型进行微调，得到第二问答模型；

12、对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型。

13、可选地，所述基于所述网络设备配置的相关数据对预先获取的预训练模型进行语言模型监督微调训练，得到第一问答模型的步骤包括：

14、基于所述网络设备配置的相关数据构建得到网络设备配置问答；

15、对所述网络设备配置问答进行序列到序列形式的数据整理，得到监督微调训练数据；

16、基于所述监督微调训练数据对所述预先获取的预训练模型进行语言模型监督微调训练，得到所述第一问答模型。

17、可选地，所述对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型的步骤包括：

18、收集第二网络设备配置问题；

19、针对所述第二网络设备配置问题，使用所述第二问答模型生成第二网络设备配置回答；

20、收集专家对所述第二网络设备配置回答的打分数据；

21、基于所述第二网络设备配置回答和所述打分数据训练奖励模型；

22、基于所述奖励模型和强化学习算法对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型。

23、可选地，所述强化学习算法包括近端策略优化算法，所述基于所述奖励模型和强化学习算法对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型的步骤包括：

24、通过所述近端策略优化算法确定所述第二问答模型的权重梯度；

25、基于所述权重梯度和所述奖励模型对所述第二问答模型进行多步优化，得到所述网络设备配置问答模型。

26、可选地，所述对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型的步骤之后包括：

27、基于推理性能优化方法对所述网络设备问答模型进行优化。

28、本专利技术实施例还提出一种网络设备配置查询装置，所述装置包括：

29、问题获取模块，获取用户输入的第一网络设备配置问题；

30、配置查询模块，将所述第一网络设备配置问题输入预先创建的网络设备配置问答模型，得到第一网络设备配置回答，所述网络设备配置问答模型是基于机器学习训练和微调优化得到。

31、本专利技术实施例还提出一种终端设备，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的网络设备配置查询程序，所述网络设备配置查询程序被所述处理器执行时实现如上所述的网络设备配置查询方法。

32、本专利技术实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有网络设备配置查询程序，所述网络设备配置查询程序被处理器执行时实现如上所述的网络设备配置查询方法。

33、本专利技术实施例提出的网络设备配置查询方法、装置、终端设备以及存储介质，获取用户输入的第一网络设备配置问题；将所述第一网络设备配置问题输入预先创建的网络设备配置问答模型，得到第一网络设备配置回答，所述网络设备配置问答模型是基于机器学习训练和微调优化得到。本专利技术实施例通过将配置网络设备时遇到的问题输入到预先创建的网络设备配置问答模型，即可得到网络设备配置答复，然后根据该网络设备配置答复去进行网络设备的配置，不需要相关技术人员学习不同网络设备的配置规则，从而降低了配置网络设备的学习成本。

本文档来自技高网...

【技术保护点】

1.一种网络设备配置查询方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述获取用户输入的第一网络设备配置问题的步骤之前包括：

3.根据权利要求2所述的方法，其特征在于，所述创建基于机器学习训练和微调优化的所述网络设备配置问答模型的步骤包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述网络设备配置的相关数据对预先获取的预训练模型进行语言模型监督微调训练，得到第一问答模型的步骤包括：

5.根据权利要求4所述的方法，其特征在于，所述对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型的步骤包括：

6.根据权利要求5所述的方法，其特征在于，所述强化学习算法包括近端策略优化算法，所述基于所述奖励模型和强化学习算法对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型的步骤包括：

7.根据权利要求6所述的方法，其特征在于，所述对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型的步骤之后包括：p>

8.一种网络设备配置查询装置，其特征在于，所述装置包括：

9.一种网络设备配置查询终端设备，其特征在于，所述网络设备配置查询终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的网络设备配置查询方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的网络设备配置查询方法。

...

【技术特征摘要】

1.一种网络设备配置查询方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述获取用户输入的第一网络设备配置问题的步骤之前包括：

3.根据权利要求2所述的方法，其特征在于，所述创建基于机器学习训练和微调优化的所述网络设备配置问答模型的步骤包括：

5.根据权利要求4所述的方法，其特征在于，所述对所述第二问答模型进行基于人类反馈的强化学习训练，得到所述网络设备配置问答模型的步骤包括：

6.根据权利要求5所述的方法，其特征在于，所述强化学习算法包括近端策略优化算法，所述基于所述奖励模型和强化学习算法...

【专利技术属性】
技术研发人员：王智民，安韬，王高杰，田海波，刘志刚，武中力，
申请(专利权)人：北京六方云信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人