【技术实现步骤摘要】
本专利技术涉及自然语言处理领域,特别涉及一种用于问答系统的模型训练方法、问答方法、用于问答系统的模型训练装置、问答装置、问答设备和存储介质。
技术介绍
1、大语言模型通过海量文本的训练,学习到充分的知识存储在其模型参数中,具有广阔的知识和优化的对话能力,直接通过大语言模型搭建问答系统也是可行的方法。但当前的大语言模型在构建问答系统时存在一些问题,例如训练大语言模型时训练知识过时且难以更新,模型输出结果不准确,出现答非所问等问题。这些问题影响了大语言模型在问答系统的应用效果和推广能力,导致大语言模型在用于问答系统时效果较差。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供用于一种用于问答系统的模型训练方法、问答方法、用于问答系统的模型训练装置、问答装置、问答设备和存储介质,解决了现有技术中基于大语言模型的问答系统回答准确性较差的问题。
2、为解决上述技术问题,本专利技术提供了一种用于问答系统的模型训练方法,包括:
3、利用预设提示词和初始大语言模型从知识文档中的
...【技术保护点】
1.一种用于问答系统的模型训练方法,其特征在于,包括:
2.根据权利要求1所述的用于问答系统的模型训练方法,其特征在于,所述利用预设提示词和初始大语言模型从知识文档中的段落中抽取隐藏知识,并利用初始向量模型构建向量数据库,包括:
3.根据权利要求1所述的用于问答系统的模型训练方法,其特征在于,所述根据所述问句向量从所述向量数据库中检索到目标文本,包括:
4.根据权利要求1所述的用于问答系统的模型训练方法,其特征在于,所述根据所述生成率和所述召回率构建损失函数,根据所述损失函数,利用反向梯度法优化所述初始大语言模型和所述初始向量模型的
...【技术特征摘要】
1.一种用于问答系统的模型训练方法,其特征在于,包括:
2.根据权利要求1所述的用于问答系统的模型训练方法,其特征在于,所述利用预设提示词和初始大语言模型从知识文档中的段落中抽取隐藏知识,并利用初始向量模型构建向量数据库,包括:
3.根据权利要求1所述的用于问答系统的模型训练方法,其特征在于,所述根据所述问句向量从所述向量数据库中检索到目标文本,包括:
4.根据权利要求1所述的用于问答系统的模型训练方法,其特征在于,所述根据所述生成率和所述召回率构建损失函数,根据所述损失函数,利用反向梯度法优化所述初始大语言模型和所述初始...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。