【技术实现步骤摘要】
本申请涉及机器学习,具体涉及一种大模型微调数据的获取方法、装置、设备及存储介质。
技术介绍
1、为了提高大模型针对特定金融场景(如客服助手、财富助手、运维助手、信贷助手、合规助手等)的应用效果,通常需要对金融大模型进行微调。在此之前,需要准备一定规模的微调数据(这些数据通常是问答对)。
2、为了获取微调数据,已有技术方案是直接在开源大模型上输入金融领域的非结构化的原始文档,然后向开源大模型提问获取生成答案。虽然这一方法能够快速获得金融知识答案数据,但当涉及到复杂且需要全面覆盖的金融外规知识领域时,开源大模型生成的答案数据经常会遇到回答不完整的情况。举例来说,假设要求大模型根据金融知识生成关于“金融机构助推事件a的主体作用”的答案数据。理论上,一个完整的回答应该包括多个方面,如机构设置、服务重心、市场定位等。然而,在实际生成的数据中,可能只得到了关于“机构设置”这一点的详细回答,而其他重要方面则被忽略。由此导致用于金融大模型微调的微调数据存在信息不完整的问题,从而影响金融大模型的微调效果和最终应用性能。
3、因此,
...【技术保护点】
1.一种大模型微调数据的获取方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从所述原始训练数据文档的多个原始语句中获取所述候选结果的目标向量分句,包括:
3.根据权利要求2所述的方法,其特征在于,所述利用重排序模型reranker从所述N个候选向量分句中确定目标向量分句,包括:
4.根据权利要求2所述的方法,其特征在于,所述对所述原始训练数据文档的每个原始语句均进行向量化和分句处理,得到多个向量分句,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于待调整模型的应用领域、训练问题、
...【技术特征摘要】
1.一种大模型微调数据的获取方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从所述原始训练数据文档的多个原始语句中获取所述候选结果的目标向量分句,包括:
3.根据权利要求2所述的方法,其特征在于,所述利用重排序模型reranker从所述n个候选向量分句中确定目标向量分句,包括:
4.根据权利要求2所述的方法,其特征在于,所述对所述原始训练数据文档的每个原始语句均进行向量化和分句处理,得到多个向量分句,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于待调整模型的应用领域、训练问题、原始训练数据文档以及训练问题的文档提示词生成输入指令,包括:
【专利技术属性】
技术研发人员:吴永飞,寿弘宇,王彦博,陈志豪,李大伟,陈生,闫括,金雨,尤佳冀,张伟,刘丽娟,董效稳,徐小芳,姬冰芳,
申请(专利权)人:华夏银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。