【技术实现步骤摘要】
本申请涉及数据处理,尤其涉及文本分类方法、电子设备及存储介质。
技术介绍
1、在自然语言处理领域,文本分类作为核心任务之一,目的是实现文本内容向预先定义类别的自动映射。经典自注意力网络通过计算序列中各词元间的相关性权重,实现全局依赖关系的自适应捕捉,其在长距离依赖建模方面较卷积神经网络(cnn)与循环神经网络(rnn)具有显著优势。该机制作为 transformer 等先进架构的核心组件,依托电子处理器实现大规模矩阵运算,已在情感分析、新闻分类、主题识别等文本分类场景中实现分类精度的显著提升,成为主流应用机制。
2、随着数据处理技术发展,数据规模的扩张,使经典自注意力网络在语义相关性计算中涉及的大规模矩阵运算存在局限,计算复杂度随数据量呈指数级增长。相关技术的处理方式受限于摩尔定律的物理约束,在算力、能耗与延迟方面难以满足经典自注意力网络的可扩展性与实时性需求,分类处理效率差,严重制约了其在大规模文本分类任务中的高效部署与应用。
技术实现思路
1、本申请提供了文本分类方法、电子
...【技术保护点】
1.一种文本分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在对所述查询向量和所述键向量进行点积运算和归一化处理之前,还包括:根据预设最大序列长度,对所述嵌入向量序列进行填充或截断处理。
3.根据权利要求1所述的方法,其特征在于,所述对所述输入文本序列进行分词和向量转换处理,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据预设分词模型对所述输入文本序列进行分割,包括:
5.根据权利要求3所述的方法,其特征在于,所述基于预设嵌入矩阵和所述预设词汇表将所述标识信息转换为固定维度的数值向量,包
6...
【技术特征摘要】
1.一种文本分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在对所述查询向量和所述键向量进行点积运算和归一化处理之前,还包括:根据预设最大序列长度,对所述嵌入向量序列进行填充或截断处理。
3.根据权利要求1所述的方法,其特征在于,所述对所述输入文本序列进行分词和向量转换处理,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据预设分词模型对所述输入文本序列进行分割,包括:
5.根据权利要求3所述的方法,其特征在于,所述基于预设嵌入矩阵和所述预设词汇表将所述标识信息转换为固定维度的数值向量,包括:
6.根据权利要求1所述的方法,其特征在于,对所述嵌入向量进行线性变换生成查询向量、键向量和值向量,包括:
7.根据权利要求1所述的方法,其特征在于,对所述查询向量和所述键向量进行点积运算和归一化处理,包括:
8...
【专利技术属性】
技术研发人员:刘海玲,张新,李辰,姜金哲,于云龙,赵雅倩,
申请(专利权)人:苏州元脑智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。