一种数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40608493 阅读：2 留言：0更新日期：2024-03-12 22:15

本发明专利技术公开了一种数据处理方法、装置、电子设备及存储介质。该方法包括：获取待处理问题；根据第一思维推理方式对所述待处理问题进行推理，获得第一思维推理结果；根据第二思维推理方式对所述待处理问题进行推理，获得第二思维推理结果，所述第二思维方式是与第一思维推理方式不同的思维方式；根据所述第一思维推理结果和第二思维推理结果生成所述待处理问题的目标推理结果。通过应用本方案，可以避免大型语言模型在解决各种数理问题时有较高概率出现中间步骤的错误的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能领域，特别涉及一种数据处理方法、装置、电子设备及存储介质。

技术介绍

1、随着深度学习技术的不断发展，用于处理自然语言的大语言模型(l ar g elanguage model，llm)得到了越来越广泛的应用，然而随着大语言模型规模的不断增大，微调的成本变得越来越高，对于不断增加的大规模的参数，仅依靠传统微调技术已经很难对模型起到有效的迁移，且越来越大的参数量使得梯度的反向传播的代价也急剧增加。在这样的背景下，提示学习应运而生。提示学习通过改造下游任务、增加专家知识等形式，使得目标任务的输入输出更加贴合原始语言模型训练时的数据。

2、思维链(chain-of-thought，cot)的是一种改进的提示策略，用于提高大语言在复杂推理任务中的性能，cot的核心思想是将推理过程分解为一系列中间推理步骤，每个步骤都建立在前一个步骤的基础上。这种层层递进的推理链类似于思维中的逻辑连续性，帮助模型更好地理解问题并生成更有说服力的答案。大型语言模型在各种推理任务中受益于“思维链”提示，拥有了一定的处理复杂的问题的能力，特别使其具有了完成数理任务上的潜力。

3、然而，虽然引入了思维链，但是大型语言模型在解决各种数理问题时依然有较高概率出现中间步骤的错误，或者没有找到正确的推理方向，导致无法得到正确结果。一方面，大型语言模型在推理过程中对中间推理步骤的强调可能会无意中引入幻觉和累积错误，而且语言模型难以自动识别并纠错；另一方面，不同类型的数理问题可能适合不同的推理方式，而思维链的模式相对单一。

技术实现思路

1、为此，本专利技术提供了一种基于大语言模型的数据处理方法、装置、电子设备及存储介质，以力图解决或者至少缓解上面存在的至少一个问题。

2、根据本专利技术的一个方面，提供一种基于大语言模型的数据处理方法，适于在电子设备中执行，所述方法包括：

3、获取待处理问题；根据第一思维推理方式对所述待处理问题进行推理，获得第一思维推理结果；根据第二思维推理方式对所述待处理问题进行推理，获得第二思维推理结果，所述第二思维方式是与第一思维推理方式不同的思维方式；根据所述第一思维推理结果和第二思维推理结果生成所述待处理问题的目标推理结果。

4、在一个示例中，所述待处理问题的目标推理结果为所述第一思维推理结果和第二思维推理结果中的一个。

5、进一步地，所述根据第一思维推理方式对所述待处理问题进行推理，获得第一思维推理结果，包括：获取第一思维推理提示词。根据第一思维推理提示词对所述待处理问题进行逐步推理，生成每一步的第一局部推理结果。在生成每一步的第一局部推理结果后，对该步的第一局部推理结果进行第一检验处理，获得所述该步的第一检验结果；其中，若所述该步的第一检验结果为未通过，则删除所述该步的第一局部推理结果，并重新生成所述该步的第一局部推理结果；否则，继续下一步推理，直至推理结束，获得第一思维推理结果。

6、在一个示例中，所述在生成每一步的第一局部推理结果后，对该步的第一局部推理结果进行第一检验处理，获得所述该步的第一检验结果，包括：获取第一检验提示词。获取第一检验对象，其中所述第一检验对象包括该步的第一局部推理结果。根据所述第一检验提示词对所述第一检验对象进行该步的第一检验处理，获得该步的第一检验对象检验结果；其中，若所述第一检验对象检验结果为未通过，则删除所述第一检验对象，重新获取新的所述第一检验对象，对新的所述第一检验对象进行第一检验处理，以获得新的所述第一检验对象检验结果；若所述第一检验对象检验结果仍为不通过，则重复前述步骤直至该步的所述第一检验对象检验结果为通过；若该步的所述第一检验对象检验结果连续为未通过的次数达到第一预定值，则将该步的所述第一检验对象检验结果设置为通过，并选择其中最近一次的第一局部推理结果作为该步的第一局部推理结果。

7、在一个示例中，所述根据第二思维推理方式对所述待处理问题进行推理，获得第二思维推理结果，包括：获取第二思维推理提示词。根据第二思维推理提示词对所述待处理问题进行逐步推理，生成每一步的第二局部推理结果。在生成每一步的第二局部推理结果后，对该步的第二局部推理结果进行第二检验处理，获得所述该步的第二检验结果；其中，若所述该步的第二检验结果为未通过，则删除所述该步的第二局部推理结果，并重新生成所述该步的第二局部推理结果；否则，继续下一步推理，直至推理结束，获得第二思维推理结果。

8、在一个示例中，所述在生成每一步的第二局部推理结果后，对该步的第二局部推理结果进行第二检验处理，获得所述该步的第二检验结果，包括：获取第二检验提示词。获取第二检验对象，其中所述第二检验对象包括该步的第二局部推理结果。根据所述第二检验提示词对所述第二检验对象进行该步的第二检验处理，获得该步的第二检验对象检验结果；其中，若所述第二检验对象检验结果为未通过，则删除所述第二检验对象，重新获取新的所述第二检验对象，对新的所述第二检验对象进行第二检验处理，以获得新的所述第二检验对象检验结果；若所述第二检验对象检验结果仍为不通过，则重复前述步骤直至该步的所述第二检验对象检验结果为通过；若该步的所述第二检验对象检验结果连续为未通过的次数达到第二预定值，则将该步的所述第二检验对象检验结果设置为通过，并选择其中最近一次的第二局部推理结果作为该步的第二局部推理结果。

9、在一个示例中，所述第一检验处理包括事实检查、逻辑检查和数据计算检查，其中，所述事实检查是指对当前推理步骤中引用的证据是否符合事实进行检验，所述逻辑检查是指对当前推理步骤使用的逻辑是否正确进行检验，所述计算检查是指对当前推理步骤的计算结果是否正确进行检验；当且仅当所述事实检查、所述逻辑检查和所述数据计算检查均为通过时，所述第一检验结果为通过，否则所述第一检验结果为未通过。

10、在另一个示例中，所述第二检验处理包括事实检查、逻辑检查和数据计算检查，其中，所述事实检查是指对当前推理步骤中引用的证据是否符合事实进行检验，所述逻辑检查是指对当前推理步骤使用的逻辑是否正确进行检验，所述计算检查是指对当前推理步骤的计算结果是否正确进行检验；当且仅当所述事实检查、所述逻辑检查和所述数据计算检查均为通过时，所述第二检验结果为通过，否则所述第二检验结果为未通过。

11、在一个示例中，所述根据所述第一思维推理结果和第二思维推理结果生成所述待处理问题的目标推理结果，包括：获取目标结果选择提示词。根据所述目标结果选择提示词、所述第一思维推理结果、所述第二思维推理结果获得所述目标推理结果。进一步地，所述根据第一思维推理方式对所述待处理问题进行推理，以及所述根据第二思维推理方式对所述待处理问题进行推理，均系基于大语言模型执行。

12、在一个示例中，所述待处理问题为数理问题。在一个示例中，所述第一思维推理方式为正向推理，所述第二思维推理方式为逆向推理。

13、根据本专利技术的又一个方面，提供一种数据处理装置，所述装置包括：

14、数据本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的数据处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其中，所述根据第一思维推理方式对所述待处理问题进行推理，获得第一思维推理结果，包括：

3.如权利要求2所述的方法，其特征在于，所述在生成每一步的第一局部推理结果后，对该步的第一局部推理结果进行第一检验处理，获得所述该步的第一检验结果，包括：

4.如权利要求1所述的方法，其中，所述根据第二思维推理方式对所述待处理问题进行推理，获得第二思维推理结果，包括：

5.如权利要求4所述的方法，其特征在于，所述在生成每一步的第二局部推理结果后，对该步的第二局部推理结果进行第二检验处理，获得所述该步的第二检验结果，包括：

6.如权利要求2或5所述的方法，其特征在于，所述第一检验处理包括事实检查、逻辑检查和数据计算检查，其中，所述事实检查是指对当前推理步骤中引用的证据是否符合事实进行检验，所述逻辑检查是指对当前推理步骤使用的逻辑是否正确进行检验，所述计算检查是指对当前推理步骤的计算结果是否正确进行检验；当且仅当所述事实检查、所述逻辑检查和所述数据

7.如权利要求1-5中任一项所述的方法，其特征在于，

8.一种数据处理装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括：

10.一种存储有程序指令的可读存储介质，其特征在于，当所述程序指令被计算设备读取并执行时，使得所述计算设备执行如权利要求1-7中任一项所述方法。

...

【技术特征摘要】

1.一种基于大语言模型的数据处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其中，所述根据第一思维推理方式对所述待处理问题进行推理，获得第一思维推理结果，包括：

4.如权利要求1所述的方法，其中，所述根据第二思维推理方式对所述待处理问题进行推理，获得第二思维推理结果，包括：

6.如权利要求2或5所述的方法，其特征在...

【专利技术属性】
技术研发人员：张子新，胡晨，周舒畅，
申请(专利权)人：上海阶跃星辰智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人