基于大语言模型的行动方案生成模型的训练方法及装置制造方法及图纸

技术编号：41621838 阅读：30 留言：0更新日期：2024-06-13 02:22

本发明专利技术提供一种基于大语言模型的行动方案生成模型的训练方法及装置，其中方法包括：获取行动方案样本的背景信息，以及初始大语言模型；基于背景信息，以及通用大语言模型，构建行动方案样本的想定数据集；基于想定数据集，以及通用大语言模型，构建行动方案样本的问题数据集；基于问题数据集，以及通用大语言模型，构建行动方案样本的方案数据集；基于问题数据集以及方案数据集，对初始大语言模型进行训练，得到行动方案生成模型。本发明专利技术提供的方法，基于连续多阶段的数据集构建，提升了训练数据的全面性、准确性、可定制性。并通过构建得到的数据集对初始大语言模型进行微调训练，提升行动方案生成模型的准确性、可行性、实用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，尤其涉及一种基于大语言模型的行动方案生成模型的训练方法及装置。

技术介绍

1、行动方案是为达成目标所规划的一系列行动步骤和决策路径。随着大语言模型(large language model，llm)在各领域的广泛应用，大语言模型时代的到来为行动方案生成注入了新的活力。大语言模型是一类强大的人工智能模型，通过深度学习和大规模神经网络训练来理解和生成自然语言文本。它通过在大量文本数据上进行自监督学习，从而使得模型能够捕捉语言的上下文信息、语法规则和语义关系，在处理语言任务上表现出色。

2、但是，大语言模型缺乏对具体情境的深刻理解，即虽然在训练过程中接触了大量文本数据，但这并不保证它能够真正理解特定任务或领域的具体情境。由此，这可能导致生成的行动方案缺乏实际可行性，与特定情况不相符。

技术实现思路

1、本专利技术提供一种基于大语言模型的行动方案生成模型的训练方法及装置，用以解决现有技术中生成的行动方案缺乏实际可行性，与特定情况不相符的缺陷。

2、本专...

【技术保护点】

1.一种基于大语言模型的行动方案生成模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的基于大语言模型的行动方案生成模型的训练方法，其特征在于，所述基于所述想定数据集，以及所述通用大语言模型，构建所述行动方案样本的问题数据集，包括：

3.根据权利要求2所述的基于大语言模型的行动方案生成模型的训练方法，其特征在于，所述基于所述通用大语言模型以及进化提示文本，对所述初始问题数据集进行进化，得到所述问题数据集，包括：

4.根据权利要求1所述的基于大语言模型的行动方案生成模型的训练方法，其特征在于，所述基于所述背景信息，以及通用大语言模型，构建所述行动...

【技术特征摘要】

1.一种基于大语言模型的行动方案生成模型的训练方法，其特征在于，包括：

4.根据权利要求1所述的基于大语言模型的行动方案生成模型的训练方法，其特征在于，所述基于所述背景信息，以及通用大语言模型，构建所述行动方案样本的想定数据集，包括：

5.根据权利要求1-4中任一项所述的基于大语言模型的行动方案生成模型的训练方法，其特征在于，所述基于所述问题数据集，以及所述通用大语言模型，构建所述行动方案样本的方案数据集，包括：

6....

【专利技术属性】
技术研发人员：徐博，张清扬，王燕娜，谷召振，张文圣，王媛媛，徐波，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人