System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,特别是涉及一种对话生成方法及相关装置、设备和存储介质。
技术介绍
1、随着信息技术的飞速发展,大语言模型在诸多行业、众多场景中均已得到广泛应用。
2、然而,大语言模型的对话能力在很大程度上取决于其训练数据时限,如大语言模型基于某年的训练数据而得到,则在对话涉及该年之后所发生事件的情况下,大语言模型通常无法对此准确回答。有鉴于此,如何提升对话回应的准确性,特别是在对话所涉主题超出大语言模型其训练数据时限的情况下,成为亟待解决的问题。
技术实现思路
1、本申请主要解决的技术问题是提供一种对话生成方法及相关装置、设备和存储介质,能够提升对话回应的准确性,特别是在对话所涉主题超出大语言模型其训练数据时限的情况下。
2、为了解决上述技术问题,本申请第一方面提供了一种对话生成方法,包括:获取目标对象输入的第一对话文本;基于第一对话文本在目标信息源进行搜索,得到与第一对话文本相关的结构化数据;至少将结构化数据输入大语言模型进行处理,得到回应第一对话文本的第二对话文本;其中,大语言模型基于样本结构化数据及样本结构化数据以自然语言描述的样本描述文本进行参数微调得到,大语言模型在以下至少一种任务上执行参数微调:基于样本结构化数据复述样本描述文本、基于样本描述文本生成样本结构化数据。
3、为了解决上述技术问题,本申请第二方面提供了一种对话生成装置,包括:对话获取模块、信息搜索模块和对话生成模块,对话获取模块,用于获取目标对象输入的第一对话文本;信息
4、为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的对话生成方法。
5、为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的对话生成方法。
6、上述方案,获取目标对象输入的第一对话文本,并基于第一对话文本在目标信息源进行搜索,得到与第一对话文本相关的结构化数据,再至少将结构化数据输入大语言模型进行处理,得到回应第一对话文本的第二对话文本,且大语言模型基于样本结构化数据及样本结构化数据以自然语言描述的样本描述文本,进行参数微调得到,大语言模型在以下至少一种任务上执行参数微调:基于样本结构化数据复述样本描述文本、基于样本描述文本生成样本结构化数据,故一方面大语言模型在回应第一对话文本之前先进行信息源搜索,以在回应第一对话文本时能够参考第一对话文本的相关数据,从而能够使大语言模型即使在对话所涉主题超出大语言模型其训练数据时限的情况下也具备对话能力,另一方面大语言模型还基于样本结构化数据及样本结构化数据以自然语言描述的样本描述文本进行参数微调,且其在以下至少一种任务上执行参数微调:基于样本结构化数据复述样本描述文本、基于样本描述文本生成样本结构化数据,从而能够在维持大语言模型原有通用理解能力的前提下,尽可能地提升大语言模型对结构化数据的理解能力,进而能够提升大语言模型在参考结构化数据回应第一对话文本时的准确性。故此,能够提升对话回应的准确性,特别是在对话所涉主题超出大语言模型其训练数据时限的情况下。
本文档来自技高网...【技术保护点】
1.一种对话生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,对所述大语言模型执行所述参数微调的步骤包括:
3.根据权利要求1所述的方法,其特征在于,对所述大语言模型执行所述参数微调的步骤包括:
4.根据权利要求1所述的方法,其特征在于,所述样本结构化数据的获取步骤包括:
5.根据权利要求1至4任一项所述的方法,其特征在于,所述大语言模型在任一种所述任务上执行所述参数微调时还包括:
6.根据权利要求5所述的方法,其特征在于,所述目标字段至少包括链接字段。
7.根据权利要求1所述的方法,其特征在于,所述至少将所述结构化数据输入大语言模型进行处理,得到回应所述第一对话文本的第二对话文本,包括:
8.一种对话生成装置,其特征在于,包括:
9.一种电子设备,其特征在于,至少包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至7任一项所述的对话生成方法。
10.一种计算机可读存储介质,其特征在于,存储有能够被
...【技术特征摘要】
1.一种对话生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,对所述大语言模型执行所述参数微调的步骤包括:
3.根据权利要求1所述的方法,其特征在于,对所述大语言模型执行所述参数微调的步骤包括:
4.根据权利要求1所述的方法,其特征在于,所述样本结构化数据的获取步骤包括:
5.根据权利要求1至4任一项所述的方法,其特征在于,所述大语言模型在任一种所述任务上执行所述参数微调时还包括:
6.根据权利要求5所述的方法,其特征在于,所述目标字段至少包括链接字段...
【专利技术属性】
技术研发人员:李亚,汪强兵,王涛,刘权,王士进,魏思,胡国平,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。