当前位置: 首页 > 专利查询>董宇宸专利>正文

基于记忆循环网络增强的大语言模型人机交互方法及系统技术方案

技术编号:43468389 阅读:28 留言:0更新日期:2024-11-27 13:05
本发明专利技术公开了一种基于记忆循环网络增强的大语言模型人机交互方法及系统,本发明专利技术方法包括将用户或者用户程序发起的任务请求编码转换为可供记忆仓库查询记忆项的单维或多维对象,从记忆仓库查询记忆项,将查询得到的记忆项筛选后生成上下文,将上下文和预设的提示词组合后输入大语言模型;获取大语言模型执行得到的输出结果,执行输出结果并获取估结果,生成包含评估报告的任务结果;若任务请求是已经完成,则将本次任务请求执行过程中的信息生成记忆项并添加至记忆仓库中。本发明专利技术旨在使大语言模型的输入端、处理阶段和输出段都能智能化地选取对推理有帮助的记忆,并跟人类智能协同进行有效的认知信息整合,从而提升对复杂问题处理解决的效率。

【技术实现步骤摘要】

本专利技术涉及计算机人工智能领域及操作系统系统领域,具体涉及一种基于记忆循环网络增强的大语言模型人机交互方法及系统


技术介绍

1、让机器在同用户(或用户应用程序)交流的同时能够学习到用户的习惯、要求、操作方式或者对某项工作的综合解决能力,从而实现人机优势互补、信息交互的群体智能系统是人工智能不懈追求的重要目标,能够极大改善用户对机器的操作感受、提高计算机或者智能系统的工作和服务效率,并能将智能服务应用到更为丰富的场景和领域。

2、通过扩大预训练语言模型的参数量和数据量,大语言模型(large languagemodel)能够在效果显著提升的同时,展示出泛化和推理能力等方面的特殊能力,如上下文学习能力、逐步推理能力等、人机对话能力和任务求解能力等。在此基础上,多模态大模型(mllm)进一步引入了多模态信息处理,能够接收多模态信息并对其进行推理,使人工智能更符合人类感知世界的方式,提供了更为用户友好的界面,并成为更全面的任务解决者。

3、然而,现有ai技术包括(mllm)在面向用户进行学习和实现智能化操作方面仍存在欠缺,主要问题包括:本文档来自技高网...

【技术保护点】

1.一种基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤S1包括:

3.根据权利要求1所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤S2包括:

4.根据权利要求3所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤S3包括:

5.根据权利要求4所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤S3.4中执行改进上下文时还包括判断执行改进上下文的次数是否超过预设阈值,若尚未超过...

【技术特征摘要】

1.一种基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s1包括:

3.根据权利要求1所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s2包括:

4.根据权利要求3所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s3包括:

5.根据权利要求4所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s3.4中执行改进上下文时还包括判断执行改进上下文的次数是否超过预设阈值,若尚未超过预设阈值,则根据大语言模型执行得到的输出结果和执行动作或者调用函数调用接口的评估结果利用大语言模型生成新的上下文,将新的上下文加入步骤s2.4中得到的上下文中,跳转步骤s2.5;否则执行下述方式中的一种:

6.根据权利要求4所述的基于记忆循环网络增强的大语言模型人机交互方法,其特征在于,步骤s3.1中取大语言模型执行得到的输出结果还包括各个记忆项的记忆贡献度,根据记忆贡献度的大小将记忆贡献度映射为多种精度级别中的一种;如果某一记忆项的记忆贡献度大于预设阈值、且该记忆项的精...

【专利技术属性】
技术研发人员:董宇宸
申请(专利权)人:董宇宸
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1