一种数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：42970905 阅读：21 留言：0更新日期：2024-10-15 13:12

本发明专利技术公开了一种数据处理方法、装置、电子设备及存储介质。该方法包括：获取待处理问题；根据第一思维推理方式对所述待处理问题进行推理，获得第一思维推理结果；根据第二思维推理方式对所述待处理问题进行推理，获得第二思维推理结果，所述第二思维方式是与第一思维推理方式不同的思维方式；根据所述第一思维推理结果和第二思维推理结果生成所述待处理问题的目标推理结果。通过应用本方案，可以避免大型语言模型在解决各种数理问题时有较高概率出现中间步骤的错误的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，特别涉及一种数据处理方法、装置、电子设备及存储介质。

技术介绍

1、随着深度学习技术的不断发展，用于处理自然语言的大语言模型(l a r g elanguage model，llm)得到了越来越广泛的应用，然而随着大语言模型规模的不断增大，微调的成本变得越来越高，对于不断增加的大规模的参数，仅依靠传统微调技术已经很难对模型起到有效的迁移，且越来越大的参数量使得梯度的反向传播的代价也急剧增加。在这样的背景下，提示学习应运而生。提示学习通过改造下游任务、增加专家知识等形式，使得目标任务的输入输出更加贴合原始语言模型训练时的数据。

2、思维链(chain-of-thought，cot)的是一种改进的提示策略，用于提高大语言在复杂推理任务中的性能，cot的核心思想是将推理过程分解为一系列中间推理步骤，每个步骤都建立在前一个步骤的基础上。这种层层递进的推理链类似于思维中的逻辑连续性，帮助模型更好地理解问题并生成更有说服力的答案。大型语言模型在各种推理任务中受益于“思维链”提示，拥有了一定的处理复杂的问题的能...

【技术保护点】

1.一种基于大语言模型的数据处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其中，所述根据第一思维推理方式对所述待处理问题进行推理，获得第一思维推理结果，包括：

3.如权利要求2所述的方法，其特征在于，所述在生成每一步的第一局部推理结果后，对该步的第一局部推理结果进行第一检验处理，获得所述该步的第一检验结果，包括：

4.如权利要求1所述的方法，其中，所述根据第二思维推理方式对所述待处理问题进行推理，获得第二思维推理结果，包括：

5.如权利要求4所述的方法，其特征在于，所述在生成每一步的第二局部推理结果后，对该步的第二局部推...

【技术特征摘要】

1.一种基于大语言模型的数据处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其中，所述根据第一思维推理方式对所述待处理问题进行推理，获得第一思维推理结果，包括：

4.如权利要求1所述的方法，其中，所述根据第二思维推理方式对所述待处理问题进行推理，获得第二思维推理结果，包括：

5.如权利要求4所述的方法，其特征在于，所述在生成每一步的第二局部推理结果后，对该步的第二局部推理结果进行第二检验处理，获得所述该步的第二检验结果，包括：

6.如权利要求2或5所述的方法，其特征在...

【专利技术属性】
技术研发人员：张子新，胡晨，
申请(专利权)人：上海阶跃星辰智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人