一种基于大语言模型的知识检索增强生成方法及其系统技术方案

技术编号：42197698 阅读：100 留言：0更新日期：2024-07-30 18:45

本申请公开了一种基于大语言模型的知识检索增强生成方法及其系统，包括：将查询问题文本转化为目标查询问题；提取出目标查询问题的关键提示词；基于文档检索增强模型根据目标查询问题在知识库中检索出待匹配文档集合；基于各个待匹配文档与目标查询问题的相关程度获得目标文档；基于关键提示词与目标文档进行匹配，得到目标文本片段；对目标文本片段进行排序，获得排序后文本片段序列；将目标查询问题和排序后文本片段序列作为输入集合输入至文本生成增强模型中，得到文本生成增强模型输出的答案文本。本申请结合文档检索和语言生成技术，能够提供更准确、更全面的答案，同时，使用了大型语言模型，使得生成的答案文本更加自然流畅。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，尤其涉及一种基于大语言模型的知识检索增强生成方法及其系统。

技术介绍

1、知识检索增强生成是一种结合了检索技术和生成模型的技术框架，旨在提升自然语言处理（nlp）任务的性能，特别是对于开放域对话、问答系统和文本生成等任务。知识检索增强生成的核心思想是利用大量的外部知识或信息来增强模型的生成能力，克服了传统端到端生成模型可能面临的知识覆盖不足、长尾现象处理不佳等问题。

2、在现有的技术中，知识检索增强生成主要有检索器、预训练语言模型、生成器组成，检索器用于从大规模文档库、知识库或预训练语言模型的嵌入索引中检索相关信息；预训练语言模型提供了强大的语义理解基础。通过预训练，模型学会了丰富的语言表示，这些表示可以用来计算文档或句子之间的相似度，从而在检索阶段选取最相关的候选信息；生成器根据检索到的知识生成连贯、准确的响应或答案，而不是仅仅复制检索到的片段。

3、当前制约知识检索增强生成的主要问题是面对大量有关联的文档，检索器仅仅依靠计算文档或文本块的相似度无法精确的检索到最相关的文档及文本块，将相似度极...

【技术保护点】

1.一种基于大语言模型的知识检索增强生成方法，其特征在于，包括：

2.根据权利要求1所述的基于大语言模型的知识检索增强生成方法，其特征在于，所述基于文档检索增强模型根据所述目标查询问题在用户私有知识库中检索出待匹配文档集合，包括：

3.根据权利要求2所述的基于大语言模型的知识检索增强生成方法，其特征在于，所述基于所述第二文档内容特征向量和所述第二查询问题特征向量，确定所述待匹配文档集合，包括：

4.根据权利要求3所述的基于大语言模型的知识检索增强生成方法，其特征在于，所述预设模型为多尺度融合前馈网络。

5.根据权利要求1至4任一项所述的基于...

【技术特征摘要】

1.一种基于大语言模型的知识检索增强生成方法，其特征在于，包括：

4.根据权利要求3所述的基于大语言模型的知识检索增强生成方法，其特征在于，所述预设模型为多尺度融合前馈网络。

5.根据权利要求1至4任一项所述的基于大语言模型的知识检索增强生成方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的基于大语言模型的知识...

【专利技术属性】
技术研发人员：刘林，许驰，李相国，刘洋，
申请(专利权)人：宏景科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人