一种长文本处理方法以及相关装置制造方法及图纸

技术编号：43885251 阅读：36 留言：0更新日期：2024-12-31 19:10

本申请属于人工智能领域，尤其涉及一种长文本处理方法以及相关装置，包括：对于当前会话中待处理的长文本数据，从长文本数据中提取各个文本片段对应的上下文信息；将各个上下文信息分别存储到外部记忆模块的不同存储区域中；外部记忆模块包括短期记忆区域和长期记忆区域；短期记忆区域用于存储当前会话中重要性达到预设条件的第一上下文信息；长期记忆区域用于存储多个会话中重复出现的第二上下文信息；多个会话包括当前会话和/或历史会话；将第一上下文信息以及第二上下文信息输入到大语言模型中，通过大语言模型实现对长文本数据的自然语言处理。该方法能够提高长文本处理的效率和准确性，增强模型的上下文记忆能力和灵活适应性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请属于人工智能领域，尤其涉及一种长文本处理方法以及相关装置。

技术介绍

1、目前，大型语言模型在自然语言处理（nlp）领域取得了显著进展，广泛应用于机器翻译、文本生成、对话系统等任务。

2、随着互联网内容的爆炸性增长，处理和理解长文本变得愈发重要。用户希望能够处理如长篇文章、完整书籍、跨会话对话等超长文本。相关技术中，大型语言模型主要依赖于自注意力机制（self-attention mechanism）来捕捉输入序列中的依赖关系。然而，随着输入长度的增加，模型的计算复杂度和内存需求呈指数级增长，这导致了长文本处理效率低下、上下文信息丢失等技术问题。可见现有的大型语言模型在处理长文本时存在明显的局限性，往往难以满足用户的上述需求。

3、因此，亟待设计一种全新的技术方案，用以克服上述至少一个技术问题。

技术实现思路

1、本申请提供了一种长文本处理方法以及相关装置，用以提高长文本处理的效率和准确性，增强模型的上下文记忆能力和灵活适应性。

2、第一方面，本申...

【技术保护点】

1.一种长文本处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将各个上下文信息分别存储到外部记忆模块的不同存储区域中，包括：

3.根据权利要求2所述的方法，其特征在于，所述将各个上下文信息分别存储到外部记忆模块的不同存储区域中，还包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述第一上下文信息以及所述第二上下文信息输入到大语言模型中，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述检索请求从所述外部记忆模块中检索与所述目标文本信息匹配的第一上下文信息以及第二上下

【技术特征摘要】

1.一种长文本处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将各个上下文信息分别存储到外部记忆模块的不同存储区域中，包括：

3.根据权利要求2所述的方法，其特征在于，所述将各个上下文信息分别存储到外部记忆模块的不同存储区域中，还包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述第一上下文信息以及所述第二上下文信息输入到大语言模型中，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述检索请求从所述外部记忆模块中检索与所述目标文本信息匹配的第一上下文信息以及第二上下文信息，包括：

6.根据权利要求5所述的方法，其特征在于，所述将检索到的第一上下文信息以及第二上下文信息进行融合处理，包括：

7.根据权利要求5所述的方法，其特征在于，所述外部记忆模块中的第一上下文信息以及第二上下文信息按照各自的文本内容特点和/或文本格式类型分别关联到对应的动态索引中；

8.根据权利要求1所述的方法，其特征在于，所述将各个上下文信息分...

【专利技术属性】
技术研发人员：闯小明，杨龚轶凡，郑瀚寻，傅婧，潘维维，戴长乐，
申请(专利权)人：中昊芯英杭州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人