一种大模型微调数据的获取方法、装置、设备及存储介质制造方法及图纸

技术编号：44976314 阅读：16 留言：0更新日期：2025-04-15 16:58

本申请公开了一种大模型微调数据的获取方法、装置、设备及存储介质。首先基于待调整模型的应用领域、训练问题、原始训练数据文档及文档提示词生成输入指令，并输入到具有反思机制的语言生成模型中，以生成多个问答结果。其中，文档提示词用于指示生成要求。再从问答结果中确定候选结果，并从原始训练数据文档中提取目标向量分句。通过计算候选结果与目标向量分句的相似度并进行阈值判断，筛选出符合条件的目标结果。最后将目标结果与训练问题组合成问答对，形成大模型微调数据。本申请通过文档提示词指导答案生成，并结合反思机制生成多个问答结果，通过相似度匹配筛选最佳答案，从而确保作为目标结果的问答结果全面、准确且符合需求。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及机器学习，具体涉及一种大模型微调数据的获取方法、装置、设备及存储介质。

技术介绍

1、为了提高大模型针对特定金融场景(如客服助手、财富助手、运维助手、信贷助手、合规助手等)的应用效果，通常需要对金融大模型进行微调。在此之前，需要准备一定规模的微调数据(这些数据通常是问答对)。

2、为了获取微调数据，已有技术方案是直接在开源大模型上输入金融领域的非结构化的原始文档，然后向开源大模型提问获取生成答案。虽然这一方法能够快速获得金融知识答案数据，但当涉及到复杂且需要全面覆盖的金融外规知识领域时，开源大模型生成的答案数据经常会遇到回答不完整的情况。举例来说，假设要求大模型根据金融知识生成关于“金融机构助推事件a的主体作用”的答案数据。理论上，一个完整的回答应该包括多个方面，如机构设置、服务重心、市场定位等。然而，在实际生成的数据中，可能只得到了关于“机构设置”这一点的详细回答，而其他重要方面则被忽略。由此导致用于金融大模型微调的微调数据存在信息不完整的问题，从而影响金融大模型的微调效果和最终应用性能。

3、因此，...

【技术保护点】

1.一种大模型微调数据的获取方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述从所述原始训练数据文档的多个原始语句中获取所述候选结果的目标向量分句，包括：

3.根据权利要求2所述的方法，其特征在于，所述利用重排序模型reranker从所述N个候选向量分句中确定目标向量分句，包括：

4.根据权利要求2所述的方法，其特征在于，所述对所述原始训练数据文档的每个原始语句均进行向量化和分句处理，得到多个向量分句，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于待调整模型的应用领域、训练问题、原始训练数据文档以及...

【技术特征摘要】

1.一种大模型微调数据的获取方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述从所述原始训练数据文档的多个原始语句中获取所述候选结果的目标向量分句，包括：

3.根据权利要求2所述的方法，其特征在于，所述利用重排序模型reranker从所述n个候选向量分句中确定目标向量分句，包括：

4.根据权利要求2所述的方法，其特征在于，所述对所述原始训练数据文档的每个原始语句均进行向量化和分句处理，得到多个向量分句，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于待调整模型的应用领域、训练问题、原始训练数据文档以及训练问题的文档提示词生成输入指令，包括：

【专利技术属性】
技术研发人员：吴永飞，寿弘宇，王彦博，陈志豪，李大伟，陈生，闫括，金雨，尤佳冀，张伟，刘丽娟，董效稳，徐小芳，姬冰芳，
申请(专利权)人：华夏银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人