一种实现大语言模型无限长上下文连续对话的方法及系统技术方案

技术编号：43868685 阅读：72 留言：0更新日期：2024-12-31 18:54

本发明专利技术提供了一种实现大语言模型无限长上下文连续对话的方法及系统，涉及人智交互技术领域，包括：用户上传数据；对用户首次提出的需求进行子问题拆分；基于数据，大语言模型对每个子问题输出结果；将每个子问题的相关数据存入结构化检索数据表，形成一条数据；基于数据，对用户之后提出的需求进行子问题拆分，对拆分出的每个子问题利用大语言模型对结构化检索数据表中每条数据中的子问题进行文本语义相似度计算，根据相似度筛选历史输出，得到该子问题的输出或重新获取输出；将每次提出的需求拆分出的多个子问题的答案进行拼接，返回给用户。本发明专利技术通过数据转换和存储，实现了无损储存每一步大语言模型数据处理的结果及无限上下文连续对话。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于人智交互，尤其是涉及一种实现大语言模型无限长上下文连续对话的方法及系统。

技术介绍

1、大语言模型连续上下文对话是有长度限制的，一般为4096个token，少量长的大语言模型可以达到10万个token。如超过token长度限制数据需要输入给大语言模型就必须进行一定的处理。

2、目前，采取的方法有两张，一种是直接截取输入的文本数据后部超限的文本部分，然后将剩余的文本输入到大模型；这也是大多数大语言模型自动处理超长文本的方式。另一种是以每轮对话(提示词，问，答)为一组，对连续上下文对话的总长度超过该大语言模型长度限制90％的那部分的那些对话组及之前超长文本的总结，用大模型进行归纳总结，输出的总结文本长度不超过10％。这样，可以使连续的让想问对话永远不超过大语言模型的长度限制。

3、但是两种方法均存在缺陷，第一种，被自动截取的部分内容因未直接或间接地传入过大语言模型，因此，会有明显的数据遗漏，使得大语言模型对用户连续上下文的理解不完全。第二种，虽然在每次增加连续对话时会将超限的对话进行归纳总结，使超限的文...

【技术保护点】

1.一种实现大语言模型无限长上下文连续对话的方法，其特征在于，包括：

2.根据权利要求1所述的实现大语言模型无限长上下文连续对话的方法，其特征在于：用户上传待分析挖掘的数据后，创建两个数据表链接路径分别存储所述数据，包括待处理的原始数据路径和原始数据副本存入的地址路径，在所述原始数据副本存入的地址路径下创建结构化检索数据表。

3.根据权利要求2所述的实现大语言模型无限长上下文连续对话的方法，其特征在于：基于待处理的原始数据路径获取所述数据，对每一个子问题进行文字回答输出给用户，或输出可执行的程序代码，将执行后获得的数据结果输出给用户。

<...

【技术特征摘要】

1.一种实现大语言模型无限长上下文连续对话的方法，其特征在于，包括：

4.根据权利要求1所述的实现大语言模型无限长上下文连续对话的方法，其特征在于：结构化检索数据表中还包括日期时间、输出类型；

5.根据权利要求1所述的实现大语言模型无限长上下文连续对话的方法，其特征在于：根据计算结果，在多条数据中选取相似度最高且输出对应的效果标记为有帮助的数据，将该数据作为该子问题的输出，并存入所述结构化检索数据表；包括：

6.一种实现大语言模型无限长上下文连续对话的系统，实现如权利要求1～5任一项所述的...

【专利技术属性】
技术研发人员：杨建雄，
申请(专利权)人：北京思特奇信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人