一种基于特征感知的文本分类方法及系统技术方案

技术编号:42445152 阅读:32 留言:0更新日期:2024-08-16 16:52
本发明专利技术属于文本分类技术领域,具体涉及一种基于特征感知的文本分类方法及系统,包括:获取待分类文本数据;提取所获取的文本数据的全局特征和局部特征;采用多头注意力机制处理所提取的文本数据的全局特征和局部特征;基于特征感知算法优化处理后的文本数据的全局特征和局部特征,动态调整特征选择和网络参数,得到文本表示特征;根据所得到的文本表示特征计算待分类文本的分类概率,完成待分类文本的分类。

【技术实现步骤摘要】

本专利技术属于文本分类,具体涉及一种基于特征感知的文本分类方法及系统


技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。

2、文本分类是自然语言处理领域的一个核心任务,涉及将文本数据自动分类到一个或多个预定义的类别。在数字化和数据驱动的时代,文本分类对于理解和组织大量未结构化的文本数据至关重要,广泛应用于情感分析、主题识别、意图检测等领域。

3、近年来,深度学习技术已成为文本分类的主要方法之一;通过使用神经网络模型,可有效地从文本中提取复杂的特征,并进行有效的分类;特别是预训练的语言模型,如bert已被证明在捕捉文本的深层语义特征方面非常有效。

4、据专利技术人了解,尽管深度学习技术已在捕捉文本的深层语义特征方面取得了显著成效,传统的优化算法,如粒子群优化算法(pso),因其简单易实现、收敛速度快的特点,也被广泛应用于各类优化问题。然而,在复杂文本分类过程中,现有方法往往依赖于表面层次的文本特征,缺乏对文本深层语义和上下文信息的充分利用;而且,传统的pso算法在高维问题和复杂搜索本文档来自技高网...

【技术保护点】

1.一种基于特征感知的文本分类方法,其特征在于,包括:

2.如权利要求1中所述的一种基于特征感知的文本分类方法,其特征在于,基于特征感知算法,对所得到的文本数据的全局特征和局部特征进行多头注意力机制处理,得到文本数据的多头注意力输出;根据注意力机制动态调整文本数据的多头注意力输出,调整注意力分数;根据所得到的调整后的注意力分数和混合编码策略,动态调整网络参数,得到文本表示特征。

3.如权利要求1中所述的一种基于特征感知的文本分类方法,其特征在于,采用特征感知算法分别对处理后的文本数据的全局特征和局部特征进行优化,得到全局特征矩阵和局部特征矩阵;对所得到的全局特征矩...

【技术特征摘要】

1.一种基于特征感知的文本分类方法,其特征在于,包括:

2.如权利要求1中所述的一种基于特征感知的文本分类方法,其特征在于,基于特征感知算法,对所得到的文本数据的全局特征和局部特征进行多头注意力机制处理,得到文本数据的多头注意力输出;根据注意力机制动态调整文本数据的多头注意力输出,调整注意力分数;根据所得到的调整后的注意力分数和混合编码策略,动态调整网络参数,得到文本表示特征。

3.如权利要求1中所述的一种基于特征感知的文本分类方法,其特征在于,采用特征感知算法分别对处理后的文本数据的全局特征和局部特征进行优化,得到全局特征矩阵和局部特征矩阵;对所得到的全局特征矩阵和局部特征矩阵进行加权求和,得到文本表示特征。

4.如权利要求1中所述的一种基于特征感知的文本分类方法,其特征在于,对所得到的文本表示特征依次进行线性变换和基于激活函数的非线性转换,根据转换结果和softmax函数,得到文本表示特征的类别概率,根据所得到的类别概率进行待分类文本的分类。

5.如权利要求1中所述的一种基于特征感知的文本分...

【专利技术属性】
技术研发人员:王继彬张鑫硕李士锋杨美红郭莹吴晓明苗顶荣于春梅
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1