文本分类方法、电子设备及存储介质技术

技术编号:46573265 阅读:1 留言:0更新日期:2025-10-10 21:18
本申请公开了一种文本分类方法、电子设备及存储介质,涉及数据处理技术领域,包括在分词阶段通过噪声过滤与标准化处理提升输入质量,在向量转换阶段借助嵌入矩阵实现语义的精准数值映射,通过查询向量、键向量的交互运算与归一化处理,分析分词单元间的语义关联并量化为权重矩阵,通过权重矩阵对值向量进行加权融合,得到包含全局上下文的综合特征,经池化压缩与二分类模型输出结果。通过优化矩阵运算逻辑、减少冗余信息处理,解决大规模文本分类任务中因密集矩阵运算导致的计算复杂度高、可扩展性不足及实时性欠缺的技术问题,达到了在保障语义理解精度的同时,显著提升文本分类效率、增强模型在大规模场景下适用性的技术效果。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及文本分类方法、电子设备及存储介质


技术介绍

1、在自然语言处理领域,文本分类作为核心任务之一,目的是实现文本内容向预先定义类别的自动映射。经典自注意力网络通过计算序列中各词元间的相关性权重,实现全局依赖关系的自适应捕捉,其在长距离依赖建模方面较卷积神经网络(cnn)与循环神经网络(rnn)具有显著优势。该机制作为 transformer 等先进架构的核心组件,依托电子处理器实现大规模矩阵运算,已在情感分析、新闻分类、主题识别等文本分类场景中实现分类精度的显著提升,成为主流应用机制。

2、随着数据处理技术发展,数据规模的扩张,使经典自注意力网络在语义相关性计算中涉及的大规模矩阵运算存在局限,计算复杂度随数据量呈指数级增长。相关技术的处理方式受限于摩尔定律的物理约束,在算力、能耗与延迟方面难以满足经典自注意力网络的可扩展性与实时性需求,分类处理效率差,严重制约了其在大规模文本分类任务中的高效部署与应用。


技术实现思路

1、本申请提供了文本分类方法、电子设备及存储介质,以至本文档来自技高网...

【技术保护点】

1.一种文本分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在对所述查询向量和所述键向量进行点积运算和归一化处理之前,还包括:根据预设最大序列长度,对所述嵌入向量序列进行填充或截断处理。

3.根据权利要求1所述的方法,其特征在于,所述对所述输入文本序列进行分词和向量转换处理,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据预设分词模型对所述输入文本序列进行分割,包括:

5.根据权利要求3所述的方法,其特征在于,所述基于预设嵌入矩阵和所述预设词汇表将所述标识信息转换为固定维度的数值向量,包括:

6...

【技术特征摘要】

1.一种文本分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在对所述查询向量和所述键向量进行点积运算和归一化处理之前,还包括:根据预设最大序列长度,对所述嵌入向量序列进行填充或截断处理。

3.根据权利要求1所述的方法,其特征在于,所述对所述输入文本序列进行分词和向量转换处理,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据预设分词模型对所述输入文本序列进行分割,包括:

5.根据权利要求3所述的方法,其特征在于,所述基于预设嵌入矩阵和所述预设词汇表将所述标识信息转换为固定维度的数值向量,包括:

6.根据权利要求1所述的方法,其特征在于,对所述嵌入向量进行线性变换生成查询向量、键向量和值向量,包括:

7.根据权利要求1所述的方法,其特征在于,对所述查询向量和所述键向量进行点积运算和归一化处理,包括:

8...

【专利技术属性】
技术研发人员:刘海玲张新李辰姜金哲于云龙赵雅倩
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1