大语言模型的推理方法、大语言模型的训练方法技术

技术编号：46061342 阅读：7 留言：0更新日期：2025-08-11 15:46

本公开提供了一种大语言模型的训练方法、大语言模型的推理方法、装置、电子设备和存储介质，涉及人工智能技术领域，尤其涉及深度学习、大语言模型、自然语言处理、内容审核技术领域。具体实现方案为：针对输入内容，确定推理树中与输入内容对应的目标节点，其中，推理树包括多级节点；根据输入内容和目标节点，生成针对输入内容进行推理的思考内容、思考结果和推理路径，其中，思考结果是从目标节点的多个候选子节点中确定的目标子节点，推理路径为由目标节点到目标子节点的路径；根据思考内容和思考结果，确定推理路径的正确性；以及响应于确定推理路径不正确，根据输入内容和目标节点，生成更新的思考内容、思考结果和推理路径。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能，尤其涉及深度学习、大语言模型、自然语言处理、内容审核。更具体地，本公开提供了一种大语言模型的推理方法、大语言模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。

技术介绍

1、随着人工智能的快速发展，大语言模型的应用越来越广泛。尤其大语言模型的推理能力，在各领域都展示出了显著的成果。

技术实现思路

1、本公开提供了一种大语言模型的推理方法、大语言模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。

2、根据第一方面，提供了一种大语言模型的推理方法，该方法包括：针对输入内容，确定推理树中与输入内容对应的目标节点，其中，推理树包括多级节点；根据输入内容和目标节点，生成针对输入内容进行推理的思考内容、思考结果和推理路径，其中，思考结果是从目标节点的多个候选子节点中确定的目标子节点，推理路径为由目标节点到目标子节点的路径；根据思考内容和思考结果，确定推理路径的正确性；以及响应于确定推理路径不正确，根据输入内容和目标节点，生成更新的思考内容、思考结果和推理路径。

<本文档来自技高网...

【技术保护点】

1.一种大语言模型的推理方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求1所述的方法，还包括：

4.根据权利要求1至3中任一项所述的方法，其中，所述根据所述思考内容和思考结果，确定所述推理路径的正确性包括：

5.根据权利要求1至3中任一项所述的方法，其中，所述节点表征所述输入内容的安全风险类别，所述子节点表征所述输入内容的安全风险子类别；所述根据所述输入内容和所述目标节点，生成针对所述输入内容进行推理的思考内容、思考结果和推理路径包括：

6.一种大语言模型的训练方法，包括：

7.根据权利要求6所...

【技术特征摘要】

1.一种大语言模型的推理方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求1所述的方法，还包括：

4.根据权利要求1至3中任一项所述的方法，其中，所述根据所述思考内容和思考结果，确定所述推理路径的正确性包括：

6.一种大语言模型的训练方法，包括：

7.根据权利要求6所述的方法，还包括：

8.根据权利要求6或7所述的方法，其中，所述根据所述思考内容和思考结果，确定所述推理路径的正确性包括：<...

【专利技术属性】
技术研发人员：马占宇，周涵，吴文权，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人