【技术实现步骤摘要】
本申请属于人工智能领域,尤其涉及一种长文本处理方法以及相关装置。
技术介绍
1、目前,大型语言模型在自然语言处理(nlp)领域取得了显著进展,广泛应用于机器翻译、文本生成、对话系统等任务。
2、随着互联网内容的爆炸性增长,处理和理解长文本变得愈发重要。用户希望能够处理如长篇文章、完整书籍、跨会话对话等超长文本。相关技术中,大型语言模型主要依赖于自注意力机制(self-attention mechanism)来捕捉输入序列中的依赖关系。然而,随着输入长度的增加,模型的计算复杂度和内存需求呈指数级增长,这导致了长文本处理效率低下、上下文信息丢失等技术问题。可见现有的大型语言模型在处理长文本时存在明显的局限性,往往难以满足用户的上述需求。
3、因此,亟待设计一种全新的技术方案,用以克服上述至少一个技术问题。
技术实现思路
1、本申请提供了一种长文本处理方法以及相关装置,用以提高长文本处理的效率和准确性,增强模型的上下文记忆能力和灵活适应性。
2、第一方面,本申
...【技术保护点】
1.一种长文本处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将各个上下文信息分别存储到外部记忆模块的不同存储区域中,包括:
3.根据权利要求2所述的方法,其特征在于,所述将各个上下文信息分别存储到外部记忆模块的不同存储区域中,还包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述第一上下文信息以及所述第二上下文信息输入到大语言模型中,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述检索请求从所述外部记忆模块中检索与所述目标文本信息匹配的第一上下文信息以及第二上下
...【技术特征摘要】
1.一种长文本处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将各个上下文信息分别存储到外部记忆模块的不同存储区域中,包括:
3.根据权利要求2所述的方法,其特征在于,所述将各个上下文信息分别存储到外部记忆模块的不同存储区域中,还包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述第一上下文信息以及所述第二上下文信息输入到大语言模型中,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述检索请求从所述外部记忆模块中检索与所述目标文本信息匹配的第一上下文信息以及第二上下文信息,包括:
6.根据权利要求5所述的方法,其特征在于,所述将检索到的第一上下文信息以及第二上下文信息进行融合处理,包括:
7.根据权利要求5所述的方法,其特征在于,所述外部记忆模块中的第一上下文信息以及第二上下文信息按照各自的文本内容特点和/或文本格式类型分别关联到对应的动态索引中;
8.根据权利要求1所述的方法,其特征在于,所述将各个上下文信息分...
【专利技术属性】
技术研发人员:闯小明,杨龚轶凡,郑瀚寻,傅婧,潘维维,戴长乐,
申请(专利权)人:中昊芯英杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。