大语言模型的推理方法、大语言模型的训练方法技术

技术编号:46061342 阅读:7 留言:0更新日期:2025-08-11 15:46
本公开提供了一种大语言模型的训练方法、大语言模型的推理方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及深度学习、大语言模型、自然语言处理、内容审核技术领域。具体实现方案为:针对输入内容,确定推理树中与输入内容对应的目标节点,其中,推理树包括多级节点;根据输入内容和目标节点,生成针对输入内容进行推理的思考内容、思考结果和推理路径,其中,思考结果是从目标节点的多个候选子节点中确定的目标子节点,推理路径为由目标节点到目标子节点的路径;根据思考内容和思考结果,确定推理路径的正确性;以及响应于确定推理路径不正确,根据输入内容和目标节点,生成更新的思考内容、思考结果和推理路径。

【技术实现步骤摘要】

本公开涉及人工智能,尤其涉及深度学习、大语言模型、自然语言处理、内容审核。更具体地,本公开提供了一种大语言模型的推理方法、大语言模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。


技术介绍

1、随着人工智能的快速发展,大语言模型的应用越来越广泛。尤其大语言模型的推理能力,在各领域都展示出了显著的成果。


技术实现思路

1、本公开提供了一种大语言模型的推理方法、大语言模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。

2、根据第一方面,提供了一种大语言模型的推理方法,该方法包括:针对输入内容,确定推理树中与输入内容对应的目标节点,其中,推理树包括多级节点;根据输入内容和目标节点,生成针对输入内容进行推理的思考内容、思考结果和推理路径,其中,思考结果是从目标节点的多个候选子节点中确定的目标子节点,推理路径为由目标节点到目标子节点的路径;根据思考内容和思考结果,确定推理路径的正确性;以及响应于确定推理路径不正确,根据输入内容和目标节点,生成更新的思考内容、思考结果和推理路径。

<本文档来自技高网...

【技术保护点】

1.一种大语言模型的推理方法,包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求1所述的方法,还包括:

4.根据权利要求1至3中任一项所述的方法,其中,所述根据所述思考内容和思考结果,确定所述推理路径的正确性包括:

5.根据权利要求1至3中任一项所述的方法,其中,所述节点表征所述输入内容的安全风险类别,所述子节点表征所述输入内容的安全风险子类别;所述根据所述输入内容和所述目标节点,生成针对所述输入内容进行推理的思考内容、思考结果和推理路径包括:

6.一种大语言模型的训练方法,包括:

7.根据权利要求6所...

【技术特征摘要】

1.一种大语言模型的推理方法,包括:

2.根据权利要求1所述的方法,还包括:

3.根据权利要求1所述的方法,还包括:

4.根据权利要求1至3中任一项所述的方法,其中,所述根据所述思考内容和思考结果,确定所述推理路径的正确性包括:

5.根据权利要求1至3中任一项所述的方法,其中,所述节点表征所述输入内容的安全风险类别,所述子节点表征所述输入内容的安全风险子类别;所述根据所述输入内容和所述目标节点,生成针对所述输入内容进行推理的思考内容、思考结果和推理路径包括:

6.一种大语言模型的训练方法,包括:

7.根据权利要求6所述的方法,还包括:

8.根据权利要求6或7所述的方法,其中,所述根据所述思考内容和思考结果,确定所述推理路径的正确性包括:<...

【专利技术属性】
技术研发人员:马占宇周涵吴文权
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1