语言大模型增强检索方法技术

技术编号：41769231 阅读：18 留言：0更新日期：2024-06-21 21:46

一种语言大模型增强检索方法，包括交互阶段；所述交互阶段进行如下步骤：S20、获取第一输入语句，S21、解析所述第一输入语句，获得第一关键词，S22、根据所述第一关键词作为索引在第一数据库中进行检索，得到预设回复语句；S23、将所述预设回复语句输入语言大模型中，所述语言大模型评估所述预设回复语句与所述第一输入语句的匹配程度，得到评估结果；通过上述方法，本发明专利技术能够在获取到用户输入语句之后能够优先进行第一数据库的检索，而语言大模型优先仅进行检索结果的评分，再对评分适合的回复进行显示。从而提升了在数据检索后对于结果的筛选能力，提升了自动回复语句的回复质量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自动化回复人工智能领域，尤其涉及一种结合语言大模型的增强检索的方法。

技术介绍

1、目前，领先的大语言模型是基于大量数据训练的，目的是让它们掌握广泛的普遍知识，这些知识被储存在它们神经网络的权重里。但是，如果我们要求大语言模型生成的回答涉及到它训练数据之外的知识——比如最新的、专有的或某个特定领域的信息——这时就可能出现事实上的错误，不能满足不同用户的需求，即出现幻觉。检索增强技术通常用于解决幻觉问题，但是增加了时间开销，增加了成本或影响用户体验。

技术实现思路

1、为此，需要提供一种能够结合既有数据库以及语言模型的各自优点的自动检索回复方法，达到提升答复准确性与回复速度；

2、为实现上述目的，专利技术人提供了一种语言大模型增强检索方法，包括交互阶段；所述交互阶段进行如下步骤：

3、s20、获取第一输入语句，

4、s21、解析所述第一输入语句，获得第一关键词，

5、s22、根据所述第一关键词作为索引在第一数据库中进行检索，得到预设回复语句；

6、s23、将所述预设回复语句输入语言大模型中，所述语言大模型评估所述预设回复语句与所述第一输入语句的匹配程度，得到评估结果；

7、s24、若所述评估结果大于第一预设值，则向用户展示所述预设回复语句，否则不显示所述预设回复语句。

8、本申请一实施例中，若所述评估结果小于第一预设值，则由所述语言大模型根据所述第一输入语句，生成模型回复语句，再向用户展示所述模型回复语句。

9、本申请一实施例中，还包括构建阶段，所述构建阶段进行如下步骤：

10、s10，构建第一数据库，所述第一数据库包括若干qa问答对，每个qa包括了一个问句和一个回复语句，以及问句和回复语句之间的关键词索引关系。

11、本申请一实施例中，还进行步骤，s11、构建向量数据库；

12、具体包括如下步骤，

13、s111、收集预设语料，将所述语料进行预分段，

14、s112、将预分段的语料转换为数值向量，

15、s113、用数值向量建立向量索引。

16、本申请一实施例中，步骤s113具体为用近似最近邻搜索算法建立向量索引。

17、本申请一实施例中，还包括步骤，用近似最近邻搜索算法建立向量索引，优化配置最近邻搜索算法的搜索参数search k，使得所述向量数据库的平均搜索时长不大于所述第一数据库的最大搜索时长+预设延时。

18、本申请一实施例中，若所述评估结果小于第一预设值，则将所述向量数据库的索引结果和第一输入语句嵌套后作为新的输入，输入所述语言大模型中，生成增强回复语句。

19、本申请一实施例中，若所述评估结果小于第一预设值，则将所述向量数据库的索引结果和第一输入语句和所述预设回复语句嵌套后作为新的输入，输入所述语言大模型中，生成增强回复语句。

20、本申请一实施例中，所述嵌套的预设模板为：q*b*p*b*ls*r*lr；其中q为用户问题，*为连接符，b为分隔符，ls、lr为左右包含符号，p为引导词，r为检索到的回复；其中p被设置为引导大模型参考r中回复的文本描述。

21、通过上述方法，本专利技术能够在获取到用户输入语句之后能够优先进行第一数据库的检索，而语言大模型优先仅进行检索结果的评分，再对评分适合的回复进行显示。从而提升了在数据检索后对于结果的筛选能力，提升了自动回复语句的回复质量。

本文档来自技高网...

【技术保护点】

1.一种语言大模型增强检索方法，其特征在于，包括交互阶段；

2.根据权利要求1所述的语言大模型增强检索方法，其特征在于，若所述评估结果小于第一预设值，则由所述语言大模型根据所述第一输入语句，生成模型回复语句，再向用户展示所述模型回复语句。

3.根据权利要求1所述的语言大模型增强检索方法，其特征在于，还包括构建阶段，所述构建阶段进行如下步骤：

4.根据权利要求3所述的语言大模型增强检索方法，其特征在于，还进行步骤，S11、构建向量数据库；

5.根据权利要求4所述的语言大模型增强检索方法，其特征在于，

6.根据权利要求4所述的语言大模型增强检索方法，其特征在于，还包括步骤，用近似最近邻搜索算法建立向量索引，优化配置最近邻搜索算法的搜索参数Search K，使得所述向量数据库的平均搜索时长不大于所述第一数据库的最大搜索时长+预设延时。

7.根据权利要求4所述的语言大模型增强检索方法，其特征在于，若所述评估结果小于第一预设值，则将所述向量数据库的索引结果和第一输入语句嵌套后作为新的输入，输入所述语言大模型中，生成增强回复语句。

8.根据权利要求4所述的语言大模型增强检索方法，其特征在于，若所述评估结果小于第一预设值，则将所述向量数据库的索引结果和第一输入语句和所述预设回复语句嵌套后作为新的输入，输入所述语言大模型中，生成增强回复语句。

9.根据权利要求8所述的语言大模型增强检索方法，其特征在于，所述嵌套的预设模板为：Q*B*P*B*LS*R*LR；其中Q为用户问题，*为连接符，B为分隔符，LS、LR为左右包含符号，P为引导词，R为检索到的回复；其中P被设置为引导大模型参考R中回复的文本描述。

...

【技术特征摘要】

1.一种语言大模型增强检索方法，其特征在于，包括交互阶段；

3.根据权利要求1所述的语言大模型增强检索方法，其特征在于，还包括构建阶段，所述构建阶段进行如下步骤：

4.根据权利要求3所述的语言大模型增强检索方法，其特征在于，还进行步骤，s11、构建向量数据库；

5.根据权利要求4所述的语言大模型增强检索方法，其特征在于，

6.根据权利要求4所述的语言大模型增强检索方法，其特征在于，还包括步骤，用近似最近邻搜索算法建立向量索引，优化配置最近邻搜索算法的搜索参数search k，使得所述向量数据库的平均搜索时长...

【专利技术属性】
技术研发人员：徐戈，苏劲松，章亮，方荟，关胤，杨晓燕，林宗基，
申请(专利权)人：闽江学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人