基于大模型的问答方法、装置、设备及存储介质制造方法及图纸

技术编号:41831431 阅读:16 留言:0更新日期:2024-06-27 18:16
本申请公开了一种基于大模型的问答方法、装置、设备及存储介质,涉及大模型技术领域,在该方法中,问答过程中可以支持多内容模态的内容输入,扩展了问答过程的使用场景,且信息的表达方式更加丰富,从而能够向大模型提供更为丰富的信息,有助于提升大模型对于输入内容理解的准确性,从而生成更为准确的答复内容,提升了答复内容的准确性。在问答过程中,该方法在会话内容包括非文本内容时,通过对会话内容和非文本内容进行多模态意图识别,多模态意图识别结果指示了会话内容与非文本内容之间的内容相关度,从而可以依据内容相关度选择相适配的目标答复模型,从而能够提升选择的答复模型的准确性,进而提升答复内容的准确性。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及大模型,提供一种基于大模型的问答方法、装置、设备及存储介质


技术介绍

1、随着人工智能(artificial intelligence,ai)技术的发展,大语言模型(largelanguage model,llm)逐渐被广泛使用。大语言模型是较为复杂的ai模型,它可以理解和生成人类语言,大语言模型的特点是规模巨大,小则十亿参数规模,大则百亿参数规模。大语言模型常被应用于文本摘要、问答和翻译等场景中。

2、例如,在问答场景中,可以采用会话的形式输入问题文本,输入的问题文本将被作为提示文本(prompt)提供给大语言模型,大语言模型可以根据prompt生成当前问题文本对应的答复内容。由于大语言模型是基于海量文本数据训练的深度学习模型,在问答场景中能够大大的提升答复内容的准确性。

3、可见,在问答场景中,提示文本是答复内容生成的主要依据,因而提示文本提供的信息更丰富且准确,则大语言模型生成的答复内容的准确性更高。但是,目前基于大语言模型的问答方案中,提示文本只能局限于文本这一单一维度,而文本维度只能提供有限的信本文档来自技高网...

【技术保护点】

1.一种基于大模型的问答方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,在所述获得至少一轮问答过程的会话内容之后,所述方法还包括:

3.如权利要求1所述的方法,其特征在于,所述根据所述多模态意图识别结果,从候选答复模型集中确定出相适配的目标答复模型,包括:

4.如权利要求1所述的方法,其特征在于,所述非文本内容包括至少一种内容模态各自对应的内容,则所述多模态意图识别结果指示:所述至少一种内容模态各自与所述会话内容之间的内容相关度;

5.如权利要求1~4任一所述的方法,其特征在于,所述对所述会话内容和所述非文本内容进...

【技术特征摘要】

1.一种基于大模型的问答方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,在所述获得至少一轮问答过程的会话内容之后,所述方法还包括:

3.如权利要求1所述的方法,其特征在于,所述根据所述多模态意图识别结果,从候选答复模型集中确定出相适配的目标答复模型,包括:

4.如权利要求1所述的方法,其特征在于,所述非文本内容包括至少一种内容模态各自对应的内容,则所述多模态意图识别结果指示:所述至少一种内容模态各自与所述会话内容之间的内容相关度;

5.如权利要求1~4任一所述的方法,其特征在于,所述对所述会话内容和所述非文本内容进行多模态意图识别,获得相应的多模态意图识别结果,包括:

6.如权利要求5所述的方法,其特征在于,所述按照预设的提示内容模版,根据所述会话内容中的文本内容和所述非文本内容,生成相应的目标提示内容,包括:

7.如权利要求5所述的方法,其特征在于,所述以所述目标提示内容作为提示指令,输入至已训练的多模态意图识别模型,获得所述多模态意图识...

【专利技术属性】
技术研发人员:朱秀红易磊黄泽谦
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1