【技术实现步骤摘要】
一种文本分类方法、装置、设备及存储介质
[0001]本申请涉及自然语言处理
,具体而言,涉及一种文本分类方法、装置、设备及存储介质。
技术介绍
[0002]文本分类问题是自然语言处理领域的一个重要研究方向,在情感分析、信息检索领域均有相关应用。层次多标签文本分类方法是解决文本分类问题的一种重要的方法,近年来,备受学者关注。
[0003]目前,在层次多标签文本分类方法中,是通过假设标签间是相互独立的,然后将其转化为二分类问题,构建多个二分类器进行层次多标签文本分类。
[0004]然而,层次多标签文本分类任务中的标签之间存在复杂的依赖关系,采用现有技术的方式对层次多标签文本进行分类会使文本分类精度降低。
技术实现思路
[0005]本申请的目的在于,针对上述现有技术中的不足,提供一种文本分类方法、装置、设备及存储介质,可以提高对文本进行分类的精度。
[0006]为实现上述目的,本申请实施例采用的技术方案如下:
[0007]第一方面,本申请实施例提供了一种文本分类方法,所述方法包 ...
【技术保护点】
【技术特征摘要】
1.一种文本分类方法,其特征在于,所述方法包括:将待分类文本中的至少一个词语分别转换成至少一个词向量;将各所述词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到所述待分类文本对应的多个短语向量;将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别输入所述文本分类模型中的标签注意力子模型,得到所述待分类文本的多个特征向量;基于所述待分类文本的各特征向量,得到所述待分类文本的分类结果,所述分类结果用于表征所述待分类文本的类别。2.根据权利要求1所述的方法,其特征在于,所述标签注意力子模型包括:图卷积层、标签注意力层;所述将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别输入所述文本分类模型中的标签注意力子模型,得到所述待分类文本的多个特征向量,包括:将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别向量输入所述标签注意力层,由所述标签注意层根据所述多个短语向量以及所述图卷积层输出的各候选类别向量,得到所述待分类文本的多个特征向量。3.根据权利要求2所述的方法,其特征在于,所述根据所述多个短语向量以及所述图卷积层输出的各候选类别向量,得到所述待分类文本的多个特征向量,包括:基于各所述候选类别向量以及各所述短语向量,确定各所述候选类别相对于各所述短语的权重;根据各所述候选类别相对于各所述短语的权重以及各所述短语向量,得到所述待分类文本的多个特征向量。4.根据权利要求2所述的方法,其特征在于,所述将所述多个短语向量以及所述待分类文本对应的层级标签结构中的各候选类别向量输入所述标签注意力层,由所述标签注意层根据所述多个短语向量以及所述图卷积层输出的各候选类别向量,得到所述待分类文本的多个特征向量之前,所述方法还包括:由所述图卷积层对所述层级标签结构中的各候选类别进行节点聚合处理,得到各候选类别向量。5.根据权利要求1
‑
4任一项所述的方法,其特征在于,所述短语注意力子模型包括:卷积层、双向长短期记忆层、以及短语注意力层;所述将各所述词向量输入预先训练得到的文本分类模型中的短语注意力子模型,得到...
【专利技术属性】
技术研发人员:王硕,周星杰,杨康,徐成国,
申请(专利权)人:上海明略人工智能集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。