【技术实现步骤摘要】
本专利技术涉及自然语言处理,尤其是一种基于动态分块及选择的长文本阅读理解方法。
技术介绍
0、技术背景
1、当前在自然语言处理领域,特别是针对长文本的理解和问答系统,常用的技术方案包括直接利用预训练的大语言模型进行处理。这些方法通常涉及以下步骤:数据输入:将需要分析的文本输入到语言模型中。特征提取:通过语言模型内部的机制对输入文本进行编码,生成特征表示。问题回答:基于生成的特征表示,模型尝试理解问题并从文本中找到相应的答案。然而,当涉及到处理非常长的文档时,传统的大语言模型方法显示出一定的局限性。当处理上下文长度超过一定限制的文本时,传统方法会出现显著的性能下降。随着文本长度的增加,维持语义连贯性和准确性的难度增大,导致最终结果的可靠性和一致性降低。现有其他方法在处理长文本理解和问答任务时存在几个主要缺陷,这些问题共同阻碍了模型在长文本理解和问答任务中的表现。当前的方法通常将输入文本分割成固定长度的块,这种做法往往会导致句子被截断,从而破坏了原始文本的逻辑结构和语义连贯性,影响对上下文的整体理解,并可能导致关键信息丢失或意义
...【技术保护点】
1.一种基于动态分块及选择的长文本阅读理解方法,其特征在于,该方法采用动态分块将长文本输入动态地划分为离散的文本块,使用选择分块选择筛选出不相关的文本片段,并将剩余的文本片段按原始顺序拼接,实现长文本阅读理解的具体步骤如下:
2.根据权利要求1所述的基于动态分块及选择的长文本阅读理解方法,其特征在于,所述动态分块采用基于语义相似度的动态分块方法或基于大语言模型内部注意力机制的分块方法,所述基于大语言模型内部注意力机制的分块方法将注意力权重较低的区域作为分块边界,从而实现对文本的分块。
3.根据权利要求1所述的基于动态分块及选择的长文本阅读理解方
...【技术特征摘要】
1.一种基于动态分块及选择的长文本阅读理解方法,其特征在于,该方法采用动态分块将长文本输入动态地划分为离散的文本块,使用选择分块选择筛选出不相关的文本片段,并将剩余的文本片段按原始顺序拼接,实现长文本阅读理解的具体步骤如下:
2.根据权利要求1所述的基于动态分块及选择的长文本阅读理解方法,其特征在于,所述动态分块采用基于语义相似度的动态分块方法或基于大语言模型内部注意力机制的分块方法,所述基于大语言模型内部注意力机制的分块方法将注意力权重较低的区域作为分块边界,从而实现对文本的分块。
3.根据...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。