System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大语言模型的问答式检索方法及系统技术方案_技高网

一种基于大语言模型的问答式检索方法及系统技术方案

技术编号:41385411 阅读:8 留言:0更新日期:2024-05-20 19:06
本发明专利技术公开了一种基于大语言模型的问答式检索方法及系统,属于人工智能技术领域,离线收集大量的来源可靠的数据,经过预处理构建本地知识库,同时记录每条数据的额外信息;用户输入问题后,利用大语言模型识别问题中的过滤条件,以及关键信息,根据过滤条件在知识库中进行筛选,再利用向量化模型将关键信息转化为向量,用语义匹配的方式在知识库中进行检索;然后将检索结果和用户的原始问题利用提示工程进行整合,输入到问答大模型中,最终将模型的回答返回给用户。本发明专利技术使得检索方式更为人性化,用户可以通过与检索系统进行自然语言交互,从而获取自己想要的数据,具有简便、高效、应用场景广泛等优点。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体地说是一种基于大语言模型的问答式检索方法及系统


技术介绍

1、检索任务是指从一个数据集合中查找和获取在一定范围内,某个特定问题或者主题的信息。这一任务通常涉及到对数据集合的筛选和过滤,以便更加快速、精确地获取用户需要的数据。合理高效的检索方法能够提高信息获取的效率,能够辅助决策和解决问题,能够推动知识创新和发展,能够提高工作效率和质量,在各个领域和应用都具有重要意义。

2、大语言模型是一种强大的人工智能模型,具备出色的文本生成和理解能力。通过训练大量文本数据,它能够学习语言的模式和规律,并根据输入的提示或问题生成连贯、合理的回答或文本。在机器翻译、自动摘要、对话系统和文本生成等领域,大语言模型已得到广泛应用。

3、传统的检索方法对于数据集合的筛选是通过外置过滤条件来实现的,用户通过选择过滤条件来对数据集合进行筛选,系统将返回在这个范围内与用户输入相关的信息。随着智能化的发展,传统的过滤方法无法应对用户自然语言交互的需求,而且用户需要自己从检索到的信息中进行总结归纳,不能满足智能化、便捷化的需求。


技术实现思路

1、本专利技术的技术任务是针对以上不足之处,提供一种基于大语言模型的问答式检索方法及系统,使得检索方式更为人性化,用户可以通过与检索系统进行自然语言交互,从而获取自己想要的数据,具有简便、高效、应用场景广泛等优点。

2、本专利技术解决其技术问题所采用的技术方案是:

3、一种基于大语言模型的问答式检索方法,该方法实现如下:

4、离线收集大量的来源可靠的数据,经过预处理构建本地知识库,同时记录每条数据的额外信息;

5、用户输入问题后,利用大语言模型识别问题中的过滤条件,以及关键信息,根据过滤条件在知识库中进行筛选,再利用向量化模型将关键信息转化为向量,用语义匹配的方式在知识库中进行检索;然后将检索结果和用户的原始问题利用提示工程进行整合,输入到问答大模型中,最终将模型的回答返回给用户。

6、传统的方法是将用户的输入与知识库中的信息做匹配,然后返回与用户输入相关的数据,但是用户在检索时往往带有一定的过滤条件,传统的方法只能通过外置筛选条件选择的方式来进行条件过滤检索结果,无法应对目前智能化的场景。在该基于大语言模型的问答式检索方法中,能够利用大语言模型抽取用户输入中的过滤条件和关键信息,并根据抽取出的过滤条件对知识库检索范围进行缩小,再利用向量检索的方式获取与用户输入中的关键信息相关的数据,这样可以简化用户与系统的交互,通过自然语言交互的方式获取想要的数据。另外,还通过提示工程的方法将检索结果和用户问题输入大语言模型中,利用大语言模型的语义理解和推理能力进行回答,从而替用户对检索结果进行进一步的处理,提高用户体验和工作效率。

7、优选的,所述每条数据的额外信息包括年份、发布方信息。

8、优选的,该方法的实现包括数据收集模块、模型微调模块、离线存储模块、用户交互模块、意图识别模块、信息检索模块和问答模块,

9、数据收集模块收集用户问题和对应的过滤条件,构建意图识别模型训练数据集;收集用户问题和相关信息,构建向量化模型训练数据集;

10、模型微调模块利用构建的数据集对基于大语言模型的意图识别模型和向量化模型进行微调,以提高其在特定领域下的模型效果;

11、离线存储模块收集大量可靠来源的数据,经过预处理后,用向量化模型将其转化为向量存储到知识库中,同时存储其溯源信息,作为过滤条件;

12、用户交互模块接受用户输入的问题,并将其传递给意图识别模块;

13、意图识别模块利用意图识别模型对用户的问题中的过滤条件和关键信息进行抽取;

14、信息检索模块首先根据抽取出的过滤条件在知识库中筛选相应范围的数据,再利用向量化模型将抽取出的关键信息转化为向量,通过向量检索的方式获取高相似度的相关数据;

15、问答模块利用提示工程将用户问题域检索到的相关数据进行整合,输入问答大语言模型中,获取模型答案;

16、最终,用户交互模块将模型答案返回给用户,完成整个问答式检索的过程。

17、优选的,所述离线存储模块收集大量可靠来源的数据并进行预处理,预处理包括数据清洗、切片、过滤。

18、优选的,所述溯源信息包括文章片段、完整文章、发布方及url。

19、本专利技术还要求保护一种基于大语言模型的问答式检索系统,包括数据收集模块、模型微调模块、离线存储模块、用户交互模块、意图识别模块、信息检索模块和问答模块。

20、优选的,该系统实现问答式检索的过程如下:

21、离线收集大量的来源可靠的数据,经过预处理构建本地知识库,同时记录每条数据的额外信息;

22、用户输入问题后,利用大语言模型识别问题中的过滤条件,以及关键信息,根据过滤条件在知识库中进行筛选,再利用向量化模型将关键信息转化为向量,用语义匹配的方式在知识库中进行检索;然后将检索结果和用户的原始问题利用提示工程进行整合,输入到问答大模型中,最终将模型的回答返回给用户。

23、优选的,所述数据收集模块收集用户问题和对应的过滤条件,构建意图识别模型训练数据集;收集用户问题和相关信息,构建向量化模型训练数据集;

24、所述模型微调模块利用构建的数据集对基于大语言模型的意图识别模型和向量化模型进行微调,以提高其在特定领域下的模型效果;

25、所述离线存储模块收集大量可靠来源的数据,经过预处理后,用向量化模型将其转化为向量存储到知识库中,同时存储其溯源信息,作为过滤条件;

26、所述用户交互模块接受用户输入的问题,并将其传递给意图识别模块;

27、所述意图识别模块利用意图识别模型对用户的问题中的过滤条件和关键信息进行抽取;

28、所述信息检索模块首先根据抽取出的过滤条件在知识库中筛选相应范围的数据,再利用向量化模型将抽取出的关键信息转化为向量,通过向量检索的方式获取高相似度的相关数据;

29、所述问答模块利用提示工程将用户问题域检索到的相关数据进行整合,输入问答大语言模型中,获取模型答案;

30、最终,所述用户交互模块将模型答案返回给用户,完成整个问答式检索的过程。

31、优选的,所述离线存储模块收集大量可靠来源的数据并进行预处理,预处理包括数据清洗、切片、过滤。

32、优选的,所述溯源信息包括文章片段、完整文章、发布方及url。

33、本专利技术的一种基于大语言模型的问答式检索方法及系统与现有技术相比,具有以下有益效果:

34、本专利技术提供的方法通过意图识别模型抽取用户输入问题中的过滤条件和关键数据,实现了用户与检索系统通过自然语言交互的方式进行检索,避免了外置检索过滤条件的复杂设置,提高了系统智能化体验,同时,利用大语言模型强大的语义理解和推理能力根据检索结果回答用户问题,在一本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的问答式检索方法,其特征在于,该方法实现如下:

2.根据权利要求1所述的一种基于大语言模型的问答式检索方法,其特征在于,所述每条数据的额外信息包括年份、发布方信息。

3.根据权利要求1或2所述的一种基于大语言模型的问答式检索方法,其特征在于,该方法的实现包括数据收集模块、模型微调模块、离线存储模块、用户交互模块、意图识别模块、信息检索模块和问答模块,

4.根据权利要求3所述的一种基于大语言模型的问答式检索方法,其特征在于,所述离线存储模块收集大量可靠来源的数据并进行预处理,预处理包括数据清洗、切片、过滤。

5.根据权利要求3所述的一种基于大语言模型的问答式检索方法,其特征在于,所述溯源信息包括文章片段、完整文章、发布方及URL。

6.一种基于大语言模型的问答式检索系统,其特征在于,包括数据收集模块、模型微调模块、离线存储模块、用户交互模块、意图识别模块、信息检索模块和问答模块。

7.根据权利要求6所述的一种基于大语言模型的问答式检索系统,其特征在于,该系统实现问答式检索的过程如下:>

8.根据权利要求6或7所述的一种基于大语言模型的问答式检索系统,其特征在于,所述数据收集模块收集用户问题和对应的过滤条件,构建意图识别模型训练数据集;收集用户问题和相关信息,构建向量化模型训练数据集;

9.根据权利要求8所述的一种基于大语言模型的问答式检索系统,其特征在于,所述离线存储模块收集大量可靠来源的数据并进行预处理,预处理包括数据清洗、切片、过滤。

10.根据权利要求8所述的一种基于大语言模型的问答式检索系统,其特征在于,所述溯源信息包括文章片段、完整文章、发布方及URL。

...

【技术特征摘要】

1.一种基于大语言模型的问答式检索方法,其特征在于,该方法实现如下:

2.根据权利要求1所述的一种基于大语言模型的问答式检索方法,其特征在于,所述每条数据的额外信息包括年份、发布方信息。

3.根据权利要求1或2所述的一种基于大语言模型的问答式检索方法,其特征在于,该方法的实现包括数据收集模块、模型微调模块、离线存储模块、用户交互模块、意图识别模块、信息检索模块和问答模块,

4.根据权利要求3所述的一种基于大语言模型的问答式检索方法,其特征在于,所述离线存储模块收集大量可靠来源的数据并进行预处理,预处理包括数据清洗、切片、过滤。

5.根据权利要求3所述的一种基于大语言模型的问答式检索方法,其特征在于,所述溯源信息包括文章片段、完整文章、发布方及url。

6.一种基于大语言模型的问答式检索系...

【专利技术属性】
技术研发人员:张思嘉黄登蓉张其来郭冬升
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1