基于大模型的信息处理方法、装置、设备和介质制造方法及图纸

技术编号:46560576 阅读:1 留言:0更新日期:2025-10-10 21:14
本公开提供了一种基于大模型的信息处理方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及机器学习、深度学习和大模型等技术领域。该方法包括:获取用户输入;在多个预设工作模式中确定目标工作模式,其中,每一个预设工作模式均具有对应的推理策略,并且设置有用于触发该推理策略的模式控制标识;以及将用户输入和目标工作模式的模式控制标识输入大模型,以得到大模型基于目标工作模式的推理策略生成的目标输出数据。

【技术实现步骤摘要】

本公开涉及人工智能,尤其涉及机器学习、深度学习和大模型等,具体涉及一种基于大模型的信息处理方法、基于大模型的信息处理装置、电子设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括自然语言处理技术、计算机视觉技术、语音识别技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

2、随着大规模语言模型(large language model,llm)的迅猛发展,支持推理的大模型已在多项任务中取得显著成效。这种模型能够生成推理过程的中间步骤,将复杂问题拆解为多个子问题并逐步验证推理链路,为后续回复内容生成打下了基础。而后,用于生成的大模型可以根据推理结果完成最终输出。这种方式不仅有助于提升输出内容的准确性,还能向用户直观呈现推理过程,使得输出更具条理性和可解释性,从而提高了输出内容的可信度本文档来自技高网...

【技术保护点】

1.一种基于大模型的信息处理方法,包括:

2.根据权利要求1所述的方法,其中,所述多个预设工作模式各自的模式控制标识均被设置为包括统一的推理起始标识,并通过在该推理起始标识之后附加或省略后续标识,以指示所述大模型触发相应的推理策略,所述后续标识包括推理结束标识和/或逻辑分隔标识。

3.根据权利要求2所述的方法,其中,所述多个预设工作模式包括强制推理模式,与所述强制推理模式对应的模式控制标识包括所述推理起始标识之后附加的所述逻辑分隔标识,并且不包括所述推理结束标识,

4.根据权利要求2所述的方法,其中,所述多个预设工作模式包括非推理模式,与所述非推理模式...

【技术特征摘要】

1.一种基于大模型的信息处理方法,包括:

2.根据权利要求1所述的方法,其中,所述多个预设工作模式各自的模式控制标识均被设置为包括统一的推理起始标识,并通过在该推理起始标识之后附加或省略后续标识,以指示所述大模型触发相应的推理策略,所述后续标识包括推理结束标识和/或逻辑分隔标识。

3.根据权利要求2所述的方法,其中,所述多个预设工作模式包括强制推理模式,与所述强制推理模式对应的模式控制标识包括所述推理起始标识之后附加的所述逻辑分隔标识,并且不包括所述推理结束标识,

4.根据权利要求2所述的方法,其中,所述多个预设工作模式包括非推理模式,与所述非推理模式对应的模式控制标识包括所述推理起始标识之后附加的所述推理结束标识,

5.根据权利要求2所述的方法,其中,所述多个预设工作模式还包括大模型自主推理模式,与所述大模型自主推理模式对应的模式控制标识在所述推理起始标识之后省略所述后续标识,

6.根据权利要求5所述的方法,其中,响应于所述大模型检测到与所述大模型自主推理模式对应的模式控制标识,并且所述大模型基于所述用户输入自主确定不需要执行推理过程,所述目标输出数据包括所述推理结束标识以及所述大模型跳过推理过程后生成的针对所述用户输入的回复数据。

<...

【专利技术属性】
技术研发人员:鲍思琪田昕陈炳金何径舟孙宇田浩吴华王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1