System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于对话思维链的隐性知识引导对话生成方法及系统技术方案_技高网

基于对话思维链的隐性知识引导对话生成方法及系统技术方案

技术编号:41251730 阅读:4 留言:0更新日期:2024-05-09 23:59
本发明专利技术涉及人工智能对话技术领域,特别涉及一种基于对话思维链的隐性知识引导对话生成方法及系统,通过获取与对话源语句相关的对话背景知识,所述对话背景知识用于描述对话任务要求及对话语句规律;将对话源语句和对话背景知识输入至预配置的大语言模型中,以利用对话背景知识作为提示指令,通过大语言模型生成对话背景知识思维链下针对对话源语句的对话回复。本发明专利技术将隐性知识以思维链方式来促使模型能够更准确调用内部知识,使模型能够搜寻内部知识并合理使用来生成有针对性、高质量的对话内容,进而较好的完成对话任务,便于在语言翻译、文本对话和文本问答等智能对话系统中的应用部署,具有较好的应用前景。

【技术实现步骤摘要】

本专利技术涉及人工智能对话,特别涉及一种基于对话思维链的隐性知识引导对话生成方法及系统


技术介绍

1、近年来,自然语言处理技术不断发展进步,促成了越来越强大的语言模型,产生了如glm、chatgpt以及llama等在内的超大规模语言模型。这些模型基于庞大的数据规模和更深的网络结构进行预训练,学习到了大量知识,在语言翻译、文本对话和文本问答等nlp任务中,发挥了令人惊讶的表现。但即使是chatgpt一问世就在诸多领域展现了其超高的潜力的大模型,也存在着一些局限性。大量评测分析实验发现,大模型在完成如知识驱动型对话任务等知识密集型任务时,存在“知识缺陷”,整体可分为两类:一是知识匮乏,即缺少相关知识;二是知识利用效果差,这包括没有或少利用知识以及错误地利用知识两种情况。

2、理论上来说,经过大量数据预训练后的大模型内部蕴含丰富的知识,它们应该能够很好地完成各项知识密集型任务。但是研究表明大模型在完成这类任务时,尤其是涉及知识的对话任务时,大模型并没有获得预期的结果。于是,考虑到大模型内部的黑盒过程,研究者分析认为这是由于对自身知识利用不充分。为了缓解上述现象,部分研究者转向对知识利用的研究。一些研究发现构造与任务用户意图保持一致的高质量提示,可以更充分调用大模型中蕴含的知识。还有研究发现,如果给每一个测试样例设计有针对性的且多样化的特定提示,大语言模型llm的性能在执行任务时就可以获得显著的提升。这些研究通过添加人类反馈或者构建高质量提示词使大模型在知识对话中获得了更好的表现,但是这不是一个容易的工作。一方面,构造人类反馈和高质量提示词的过程繁琐费时;另一方面,人工构建的提示往往难以充分平衡内容多样性和数据针对性。尽管后续的工作提出了自动提示的方法,能够在减小人工设计提示工作量的同时丰富提示内容,然而这仍然受限制于有限的提示格式,生成的提示无法引导大模型充分地调用知识。


技术实现思路

1、为此,本专利技术提供一种基于对话思维链的隐性知识引导对话生成方法及系统,解决现有语言模型知识利用不充分的问题,将隐性知识以思维链方式来促使模型能够更准确调用内部知识,提高对话生成质量,以适用于人工智能对话系统中的具体应用。

2、按照本专利技术所提供的设计方案,一方面,提供一种基于对话思维链的隐性知识引导对话生成方法,包含:

3、获取与对话源语句相关的对话背景知识,所述对话背景知识用于描述对话任务要求及对话语句规律;

4、将对话源语句和对话背景知识输入至预配置的大语言模型中,以利用对话背景知识作为提示指令,通过大语言模型生成对话背景知识思维链下针对对话源语句的对话回复。

5、作为本专利技术基于对话思维链的隐性知识引导对话生成方法,进一步地,获取与对话源语句相关的对话背景知识,包含:

6、首先,设置模型对话任务引导指令,将引导指令作为描述对话任务要求的知识;

7、然后,从对话样本数据集中筛选与对话源语句最相关的对话对,依据对话对并利用大模型生成对应的思维链,将对话对和思维链作为描述对话语句规律的知识。

8、作为本专利技术基于对话思维链的隐性知识引导对话生成方法,进一步地,从对话样本数据集中筛选与对话源语句最相关的对话对,包含:

9、从预设知识库中收集对话样本数据集,所述对话样本数据集包含n个对话对,每个对话对由源语句和目标语句构成;

10、从对话样本数据集中筛选出m个具有代表性的对话对,其中,m<n。

11、作为本专利技术基于对话思维链的隐性知识引导对话生成方法,进一步地,从对话样本数据集中筛选出m个具有代表性的对话对,包括:

12、基于预训练的语言模型获取对话对中各源语句向量表示,利用聚类方法对源语句向量表示进行聚类分析,依据每个类中距离中心最近的样本获取具有代表性的对话对。

13、作为本专利技术基于对话思维链的隐性知识引导对话生成方法,进一步地,利用聚类方法对源语句向量表示进行聚类分析,包含:

14、首先,将所有源语句向量表示聚类,计算聚类结果中类内相似度和类间相似度,并记录各最接近聚类中心的源句子;

15、然后,基于类内相似度和类间相似度并利用平均轮廓方法计算轮廓系数,将轮廓系数最大值作为最佳聚类数,将该最佳聚类数赋值m,以依据最佳聚类数从最接近聚类中心记录中选取具有代表性的对话对。

16、作为本专利技术基于对话思维链的隐性知识引导对话生成方法,进一步地,轮廓系数v计算方法表示为:其中,a(i)为类内相似度,b(i)为类间相似度。

17、作为本专利技术基于对话思维链的隐性知识引导对话生成方法,进一步地,利用对话背景知识作为提示指令,还包含:

18、基于对话任务要求、对话语句规律及对话源语句生成提示指令模板,以依据提示指令模板,通过大语言模型生成对话背景知识思维链下针对对话源语句的对话回复。

19、再一方面,本专利技术还提供一种基于对话思维链的隐性知识引导对话生成系统,包含:知识获取模块和对话生成模块,其中,

20、知识获取模块,用于获取与对话源语句相关的对话背景知识,所述对话背景知识用于描述对话任务要求及对话语句规律;

21、对话生成模块,用于将对话源语句和对话背景知识输入至预配置的大语言模型中,以利用对话背景知识作为提示指令,通过大语言模型生成对话背景知识思维链下针对对话源语句的对话回复。

22、本专利技术的有益效果:

23、本专利技术将<对话内容→知识挖掘→知识利用→回复生成>的思维链应用于对话任务,利用隐式知识引导模型遵循对话思维,使模型能够执行先查询对话背景知识再基于知识生成回答的知识思维链路径,并基于引导指令和对话规律约束模型知识生成过程,使模型能够搜寻内部知识并合理使用来生成有针对性、高质量的对话内容,进而较好的完成对话任务,便于在语言翻译、文本对话和文本问答等智能对话系统中的应用部署,具有较好的应用前景。

本文档来自技高网...

【技术保护点】

1.一种基于对话思维链的隐性知识引导对话生成方法,其特征在于,包含:

2.根据权利要求1所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,获取与对话源语句相关的对话背景知识,包含:

3.根据权利要求2所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,从对话样本数据集中筛选与对话源语句最相关的对话对,包含:

4.根据权利要求3所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,从对话样本数据集中筛选出m个具有代表性的对话对,包括:

5.根据权利要求4所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,利用聚类方法对源语句向量表示进行聚类分析,包含:

6.根据权利要求5所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,轮廓系数V计算方法表示为:其中,a(i)为类内相似度,b(i)为类间相似度。

7.根据权利要求1所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,利用对话背景知识作为提示指令,还包含:

8.一种基于对话思维链的隐性知识引导对话生成系统,其特征在于,包含:知识获取模块和对话生成模块,其中,

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当计算机程序被执行时,能够实现如权利要求1~7任一项所述的方法。

...

【技术特征摘要】

1.一种基于对话思维链的隐性知识引导对话生成方法,其特征在于,包含:

2.根据权利要求1所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,获取与对话源语句相关的对话背景知识,包含:

3.根据权利要求2所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,从对话样本数据集中筛选与对话源语句最相关的对话对,包含:

4.根据权利要求3所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,从对话样本数据集中筛选出m个具有代表性的对话对,包括:

5.根据权利要求4所述的基于对话思维链的隐性知识引导对话生成方法,其特征在于,利用聚类方法对源语句向量表示进行聚类分析,包...

【专利技术属性】
技术研发人员:屈丹彭思思魏晗张昊张文林李真
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1