一种基于动态分块及选择的长文本阅读理解方法技术

技术编号:45911601 阅读:9 留言:0更新日期:2025-07-25 17:44
本发明专利技术公开了一种基于动态分块及选择的长文本阅读理解方法,其特点是该方法采用动态分块将长文本输入动态地划分为离散的文本块,使用选择分块选择筛选出不相关的文本片段,并将剩余的文本片段按原始顺序拼接,以符合大语言模型预定义的上下文窗口限制,具体包括:文本预处理、动态分块、块选择和大模型输出等步骤。本发明专利技术与现有技术相比具有提高语义连贯性和理解准确性,增强模型对超长文本的处理能力,确保每个分块内部语义完整,减少因分块导致的语义歧义,避免了固定长度分块导致的语义连贯性破坏,提高语义连贯性和理解准确性,增强了模型对超长文本的处理能力,数据利用效率高,在实际应用中具有重要的价值和良好的运用前景。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其是一种基于动态分块及选择的长文本阅读理解方法


技术介绍

0、技术背景

1、当前在自然语言处理领域,特别是针对长文本的理解和问答系统,常用的技术方案包括直接利用预训练的大语言模型进行处理。这些方法通常涉及以下步骤:数据输入:将需要分析的文本输入到语言模型中。特征提取:通过语言模型内部的机制对输入文本进行编码,生成特征表示。问题回答:基于生成的特征表示,模型尝试理解问题并从文本中找到相应的答案。然而,当涉及到处理非常长的文档时,传统的大语言模型方法显示出一定的局限性。当处理上下文长度超过一定限制的文本时,传统方法会出现显著的性能下降。随着文本长度的增加,维持语义连贯性和准确性的难度增大,导致最终结果的可靠性和一致性降低。现有其他方法在处理长文本理解和问答任务时存在几个主要缺陷,这些问题共同阻碍了模型在长文本理解和问答任务中的表现。当前的方法通常将输入文本分割成固定长度的块,这种做法往往会导致句子被截断,从而破坏了原始文本的逻辑结构和语义连贯性,影响对上下文的整体理解,并可能导致关键信息丢失或意义扭曲。此外,预训练t本文档来自技高网...

【技术保护点】

1.一种基于动态分块及选择的长文本阅读理解方法,其特征在于,该方法采用动态分块将长文本输入动态地划分为离散的文本块,使用选择分块选择筛选出不相关的文本片段,并将剩余的文本片段按原始顺序拼接,实现长文本阅读理解的具体步骤如下:

2.根据权利要求1所述的基于动态分块及选择的长文本阅读理解方法,其特征在于,所述动态分块采用基于语义相似度的动态分块方法或基于大语言模型内部注意力机制的分块方法,所述基于大语言模型内部注意力机制的分块方法将注意力权重较低的区域作为分块边界,从而实现对文本的分块。

3.根据权利要求1所述的基于动态分块及选择的长文本阅读理解方法,其特征在于,所述...

【技术特征摘要】

1.一种基于动态分块及选择的长文本阅读理解方法,其特征在于,该方法采用动态分块将长文本输入动态地划分为离散的文本块,使用选择分块选择筛选出不相关的文本片段,并将剩余的文本片段按原始顺序拼接,实现长文本阅读理解的具体步骤如下:

2.根据权利要求1所述的基于动态分块及选择的长文本阅读理解方法,其特征在于,所述动态分块采用基于语义相似度的动态分块方法或基于大语言模型内部注意力机制的分块方法,所述基于大语言模型内部注意力机制的分块方法将注意力权重较低的区域作为分块边界,从而实现对文本的分块。

3.根据...

【专利技术属性】
技术研发人员:贺国秀盛博恒
申请(专利权)人:华东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1