一种利用LLM实现知识库精准输出的方法、介质及系统技术方案

技术编号:39043824 阅读:14 留言:0更新日期:2023-10-10 11:56
本发明专利技术提供了一种利用LLM实现知识库精准输出的方法、介质及系统,属于知识库精准输出技术领域,该利用LLM实现知识库精准输出的方法包括:对知识库中的知识进行向量化处理,得到包含有多个知识向量的知识向量数据集;获取用户的问题并来向量化处理,得到问题向量;使用问题向量与所述知识向量数据集进行匹配,得到匹配度最高的M个知识向量;以得到的M个知识向量进行文本处理,得到对应的问题文本作为prompt并提交给N个LLM模型,得到N个输出文本;对得到的N个输出文本进行相关度分析,以相关度最高的输出文本作为输出结果。本方法、介质及系统更好地发挥LLM的语言理解与生成能力,实现对大规模知识库的精准检索和表达。实现对大规模知识库的精准检索和表达。实现对大规模知识库的精准检索和表达。

【技术实现步骤摘要】
一种利用LLM实现知识库精准输出的方法、介质及系统


[0001]本专利技术属于知识库精准输出
,具体而言,涉及一种利用LLM实现知识库精准输出的方法、介质及系统。

技术介绍

[0002]随着互联网的快速发展,网络上形成了海量的文本知识库,这为人们学习和获取知识提供了极大的便利。但是,如何从繁杂的网络文本中快速准确地获取所需知识,仍然是一个待解决的难题。传统的基于词向量的文本匹配方法,匹配准确度较低。近年来,大语言模型(LLM)技术获得了长足的发展,在自然语言理解任务上展现了强大的能力,LLM即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。所谓"语言模型",就是只用来处理语言文字(或者符号体系)的 AI 模型,发现其中的规律,可以根据提示 (prompt),自动生成符合这些规律的内容。LLM 通常基于神经网络模型,使用大规模的语料库进行训练,比如使用互联网上的海量文本数据。这些模型通常拥有数十亿到数万亿个参数,能够处理各种自然语言处理任务,如自然语言生成、文本分类、文本摘要、机器翻译、语音识别等。而如何利用LLM的强大语言理解能力,实现对大规模文本知识库的精准检索和表达,是一个值得探索的课题。目前,利用LLM实现知识库精准输出的相关技术还不够成熟。现有的方法主要基于语义匹配的策略,利用LLM对问题和知识库进行编码,然后计算编码之间的相似度,选择相似度最高的知识文本作为输出。这种方法存在两个问题:1)依赖语义匹配,不能充分利用LLM的语言生成能力;2)匹配过程中无法考虑上下文语义,导致输出不够准确。为实现知识库的精准输出,需要研究如何更好地利用LLM的语言理解与生成双重能力,在充分理解语义的基础上,生成符合语境的知识表达。这需要在编码语义表示的基础上,进一步引入语境建模,使LLM充分理解问题的语义及语境信息,从而产生准确、流畅、符合上下文语义的知识表达。
[0003]总体而言,现有技术无法有效解决知识库精准输出的问题,急需一种新的技术方案,以更好地发挥LLM的语言理解与生成能力,实现对大规模知识库的精准检索和表达。

技术实现思路

[0004]有鉴于此,本专利技术提供一种利用LLM实现知识库精准输出的方法、介质及系统,解决了现有技术不能发挥LLM的语言理解与生成能力,无法实现对大规模知识库的精准检索和表达的技术问题。
[0005]本专利技术是这样实现的:本专利技术的第一方面提供一种利用LLM实现知识库精准输出的方法,包括以下步骤:S10、对知识库中的知识进行向量化处理,得到包含有多个知识向量的知识向量数据集;S20、获取用户的问题并来向量化处理,得到问题向量;S30、使用问题向量,与所述知识向量数据集进行匹配,得到匹配度最高的M个知识
向量;S40、以得到的M个知识向量进行文本处理,得到对应的问题文本作为prompt;S50、将得到的prompt提交给N个LLM模型后,得到N个输出文本;S60、对得到的N个输出文本进行相关度分析,以相关度最高的输出文本作为输出结果。
[0006]在上述技术方案的基础上,本专利技术的一种利用LLM实现知识库精准输出的方法还可以做如下改进:其中,所述对得到的N个输出文本进行相关度分析,以相关度最高的输出文本作为输出结果的步骤,具体是:S61、对得到N个输出文本进行向量化处理得到N个输出向量;S62、将每个输出向量与知识库进行相关度分析,得到每个输出向量的相关度;S63、若相关度最大的输出向量的相关度大于相关度阈值,则将相关度最大的输出向量对应的输出文本作为输出结果;若不存在大于相关度阈值的输出向量,则重复执行步骤S40

S60或调整M的值后重复执行步骤S30

S60,直到得到符合相关度要求的输出文本或超过最大循环次数;若超过最大循环次数则以历次循环中相关度最高的输出向量对应的输出文本作为输出结果。
[0007]对M进行调整,一般是将M+1。
[0008]进一步的,所述若不存在大于相关度阈值的输出向量,则重复执行步骤S40

S60,直到得到符合相关度要求的输出文本或超过最大循环次数的步骤,还包括在重复执行步骤S40后对prompt进行优化的步骤,具体是:步骤1、将上一循环得到的N个输出文本利用LLM进行总结,得到N个总结文本;步骤2、将prompt与得到的N个总结文本合并,得到N个合并文本;步骤3、将N个合并文本与用户的问题进行相关度分析,以相关度最高的合并文本作为目标文本;步骤4、将目标文本提交给生成所述目标文本的LLM模型,分析生成新的prompt替换原来的prompt,实现prompt的优化。
[0009]其中,所述N个LLM均采用API调用的方式。
[0010]其中,所述对知识库中的知识进行向量化处理以及获取用户的问题并来向量化处理的步骤中,向量化的方法为采用Word2Vec将知识库中的知识文本或用户的问题文本处理为向量。
[0011]其中,所述使用问题向量,与所述知识向量数据集进行匹配,得到匹配度最高的M个知识向量,的步骤具体为:计算所述问题向量和所述知识向量数据集中每一个知识向量进行相似度计算,选定M个匹配度最高的M个知识向量作为问题匹配结果,其中相似度计算的方法为余弦相似度。
[0012]其中,所述以得到的M个知识向量进行文本处理,得到对应的问题文本作为prompt的步骤,具体包括:将得到的M个知识向量映射为自然语言,转换为文本表达;将文本表达得到的文本拼接为一个prompt序列。
[0013]其中,M=5;N=3。
[0014]本专利技术的第二方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有程序指令,所述程序指令运行时,用于执行上述的一种利用LLM实现知识库精准输出的方法。
[0015]本专利技术的第三方面提供一种利用LLM实现知识库精准输出系统,包含上述的计算机可读存储介质。
[0016]具体的,本专利技术提出的一种利用LLM实现知识库精准输出的方法,通过语义匹配获取候选知识,并利用LLM的生成能力进行多轮交互求精,实现了知识库文本的精准检索和表达。该方法具有以下技术效果:1. 提高了知识检索的准确率本专利技术通过向量化表示问句和知识,计算向量间相似度进行初步匹配,可以提高与问句相关的知识被检索到的概率,避免大量不相关知识的干扰。相比仅依赖关键词匹配的传统方法,本专利技术的向量匹配显著提升了知识检索的准确率。
[0017]2. 增强了知识表达的正确性和流畅性通过将匹配到的知识向量作为prompt,提交给LLM生成响应文本,可以充分发挥LLM的语言生成能力,产生符合语境的知识表达。相比直接输出检索到的知识文本,本专利技术合成的响应文本在语法、语义上都更加通顺、准确。
[0018]3. 实现了知识输出的迭代优化本专利技术设计了基于相关度分析的多轮交互机制,可以迭代优化知识表达,直到满足精度要求。同时,还可以通过总结prompt的优化进一步提升每轮的效果。这种渐进求精的策略本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用LLM实现知识库精准输出的方法,其特征在于,包括以下步骤:S10、对知识库中的知识进行向量化处理,得到包含有多个知识向量的知识向量数据集;S20、获取用户的问题并来向量化处理,得到问题向量;S30、使用问题向量,与所述知识向量数据集进行匹配,得到匹配度最高的M个知识向量;S40、以得到的M个知识向量进行文本处理,得到对应的问题文本作为prompt;S50、将得到的prompt提交给N个LLM模型后,得到N个输出文本;S60、对得到的N个输出文本进行相关度分析,以相关度最高的输出文本作为输出结果。2.根据权利要求1所述的一种利用LLM实现知识库精准输出的方法,其特征在于,所述对得到的N个输出文本进行相关度分析,以相关度最高的输出文本作为输出结果的步骤,具体是:S61、对得到N个输出文本进行向量化处理得到N个输出向量;S62、将每个输出向量与知识库进行相关度分析,得到每个输出向量的相关度;S63、若相关度最大的输出向量的相关度大于相关度阈值,则将相关度最大的输出向量对应的输出文本作为输出结果;若不存在大于相关度阈值的输出向量,则重复执行步骤S40

S60或调整M的值后重复执行步骤S30

S60,直到得到符合相关度要求的输出文本或超过最大循环次数;若超过最大循环次数则以历次循环中相关度最高的输出向量对应的输出文本作为输出结果。3.根据权利要求2所述的一种利用LLM实现知识库精准输出的方法,其特征在于,所述若不存在大于相关度阈值的输出向量,则重复执行步骤S40

S60,直到得到符合相关度要求的输出文本或超过最大循环次数的步骤,还包括在重复执行步骤S40后对prompt进行优化的步骤,具体是:步骤1、将上一循环得到的N个输出文本利用LLM进行总结,得到N个总结文本;步骤2、将prompt与得...

【专利技术属性】
技术研发人员:周书田于海洋王炳文彭晓彬孙桂英洪锋薛雁
申请(专利权)人:青岛网信信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1