【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种基于大语言模型的行动方案生成模型的训练方法及装置。
技术介绍
1、行动方案是为达成目标所规划的一系列行动步骤和决策路径。随着大语言模型(large language model,llm)在各领域的广泛应用,大语言模型时代的到来为行动方案生成注入了新的活力。大语言模型是一类强大的人工智能模型,通过深度学习和大规模神经网络训练来理解和生成自然语言文本。它通过在大量文本数据上进行自监督学习,从而使得模型能够捕捉语言的上下文信息、语法规则和语义关系,在处理语言任务上表现出色。
2、但是,大语言模型缺乏对具体情境的深刻理解,即虽然在训练过程中接触了大量文本数据,但这并不保证它能够真正理解特定任务或领域的具体情境。由此,这可能导致生成的行动方案缺乏实际可行性,与特定情况不相符。
技术实现思路
1、本专利技术提供一种基于大语言模型的行动方案生成模型的训练方法及装置,用以解决现有技术中生成的行动方案缺乏实际可行性,与特定情况不相符的缺陷。
2、本专
...【技术保护点】
1.一种基于大语言模型的行动方案生成模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的行动方案生成模型的训练方法,其特征在于,所述基于所述想定数据集,以及所述通用大语言模型,构建所述行动方案样本的问题数据集,包括:
3.根据权利要求2所述的基于大语言模型的行动方案生成模型的训练方法,其特征在于,所述基于所述通用大语言模型以及进化提示文本,对所述初始问题数据集进行进化,得到所述问题数据集,包括:
4.根据权利要求1所述的基于大语言模型的行动方案生成模型的训练方法,其特征在于,所述基于所述背景信息,以及通用大语
...【技术特征摘要】
1.一种基于大语言模型的行动方案生成模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的行动方案生成模型的训练方法,其特征在于,所述基于所述想定数据集,以及所述通用大语言模型,构建所述行动方案样本的问题数据集,包括:
3.根据权利要求2所述的基于大语言模型的行动方案生成模型的训练方法,其特征在于,所述基于所述通用大语言模型以及进化提示文本,对所述初始问题数据集进行进化,得到所述问题数据集,包括:
4.根据权利要求1所述的基于大语言模型的行动方案生成模型的训练方法,其特征在于,所述基于所述背景信息,以及通用大语言模型,构建所述行动方案样本的想定数据集,包括:
5.根据权利要求1-4中任一项所述的基于大语言模型的行动方案生成模型的训练方法,其特征在于,所述基于所述问题数据集,以及所述通用大语言模型,构建所述行动方案样本的方案数据集,包括:
6....
【专利技术属性】
技术研发人员:徐博,张清扬,王燕娜,谷召振,张文圣,王媛媛,徐波,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。