【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种答案生成方法、装置、设备及存储介质。
技术介绍
1、chatgpt等智能模型充分显示了大语言模型在生成、推理等方面的能力,使个人智能助理的开发应用成为可能。例如,rlhf算法显示了强化学习在大语言模型对齐方面的有效性。lora等delta tuning类算法提供了不改动原始大模型参数进行微调的途径。但是在用户使用这些模型进行问答时,对用户提供的都是统一的对话服务,并没有针对用户的个性化服务,无法满足用户的个性化需求。
2、上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本专利技术的主要目的在于提供了一种答案生成方法、装置、设备及存储介质,旨在解决现有技术大语言模型对用户提供的都是统一的对话服务,无法满足用户的个性化需求的技术问题。
2、为实现上述目的,本专利技术提供了一种答案生成方法,所述方法包括以下步骤:
3、在接收到用户的模型预测指令时,获取所述模型预测指令对应的人设信
...【技术保护点】
1.一种答案生成方法,其特征在于,所述答案生成方法包括以下步骤:
2.如权利要求1所述的答案生成方法,其特征在于,所述确定所述人设信息对应的个性化模型的步骤之前,还包括:
3.如权利要求2所述的答案生成方法,其特征在于,所述根据所述预设人设信息对预设基础大语言模型进行模型训练,得到各个所述人设对应的个性化模型的步骤之后,还包括:
4.如权利要求3所述的答案生成方法,其特征在于,所述根据所述答案信息和所述特定问题对所述个性化模型进行强化训练的步骤,包括:
5.如权利要求4所述的答案生成方法,其特征在于,所述确定各个所述答案
...【技术特征摘要】
1.一种答案生成方法,其特征在于,所述答案生成方法包括以下步骤:
2.如权利要求1所述的答案生成方法,其特征在于,所述确定所述人设信息对应的个性化模型的步骤之前,还包括:
3.如权利要求2所述的答案生成方法,其特征在于,所述根据所述预设人设信息对预设基础大语言模型进行模型训练,得到各个所述人设对应的个性化模型的步骤之后,还包括:
4.如权利要求3所述的答案生成方法,其特征在于,所述根据所述答案信息和所述特定问题对所述个性化模型进行强化训练的步骤,包括:
5.如权利要求4所述的答案生成方法,其特征在于,所述确定各个所述答案信息对应的答案分值的步骤,包括:
6.如权利要求5所述的答案生成方法,其特征在于...
【专利技术属性】
技术研发人员:张向征,贾守盛,何鑫,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。