【技术实现步骤摘要】
本专利技术涉及人工智能领域,特别涉及一种数据处理方法、装置、电子设备及存储介质。
技术介绍
1、随着深度学习技术的不断发展,用于处理自然语言的大语言模型(l a r g elanguage model,llm)得到了越来越广泛的应用,然而随着大语言模型规模的不断增大,微调的成本变得越来越高,对于不断增加的大规模的参数,仅依靠传统微调技术已经很难对模型起到有效的迁移,且越来越大的参数量使得梯度的反向传播的代价也急剧增加。在这样的背景下,提示学习应运而生。提示学习通过改造下游任务、增加专家知识等形式,使得目标任务的输入输出更加贴合原始语言模型训练时的数据。
2、思维链(chain-of-thought,cot)的是一种改进的提示策略,用于提高大语言在复杂推理任务中的性能,cot的核心思想是将推理过程分解为一系列中间推理步骤,每个步骤都建立在前一个步骤的基础上。这种层层递进的推理链类似于思维中的逻辑连续性,帮助模型更好地理解问题并生成更有说服力的答案。大型语言模型在各种推理任务中受益于“思维链”提示,拥有了一定的处理复杂的问题的能
...【技术保护点】
1.一种基于大语言模型的数据处理方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其中,所述根据第一思维推理方式对所述待处理问题进行推理,获得第一思维推理结果,包括:
3.如权利要求2所述的方法,其特征在于,所述在生成每一步的第一局部推理结果后,对该步的第一局部推理结果进行第一检验处理,获得所述该步的第一检验结果,包括:
4.如权利要求1所述的方法,其中,所述根据第二思维推理方式对所述待处理问题进行推理,获得第二思维推理结果,包括:
5.如权利要求4所述的方法,其特征在于,所述在生成每一步的第二局部推理结果后
...【技术特征摘要】
1.一种基于大语言模型的数据处理方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其中,所述根据第一思维推理方式对所述待处理问题进行推理,获得第一思维推理结果,包括:
3.如权利要求2所述的方法,其特征在于,所述在生成每一步的第一局部推理结果后,对该步的第一局部推理结果进行第一检验处理,获得所述该步的第一检验结果,包括:
4.如权利要求1所述的方法,其中,所述根据第二思维推理方式对所述待处理问题进行推理,获得第二思维推理结果,包括:
5.如权利要求4所述的方法,其特征在于,所述在生成每一步的第二局部推理结果后,对该步的第二局部推理结果进行第二检验处理,获得所述该步的第二检验结果,包括:
6.如权利要求2或5所述的方法,其特征在...
【专利技术属性】
技术研发人员:张子新,胡晨,
申请(专利权)人:上海阶跃星辰智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。