一种基于生成式多任务学习模型的文本分类方法技术

技术编号：22330188 阅读：23 留言：0更新日期：2019-10-19 12:17

本发明专利技术构建一种基于生成式多任务学习模型的文本分类方法，通过训练集根据多标签分类任务和层次分类任务交替对所述多任务分类模型进行解码，解码获得与编码时刻特征向量相关的当前时刻语义特征并进行训练；根据训练结果和真实标签集对多任务分类模型进行优化，获得优化多任务分类模型；将待测集中的数据输入上述优化多任务分类模型，分别获得分类标签从而完成分类；上述模型在训练过程中通过多任务机制构建了多标签分类模型与层次分类模型之间的语义关联性，因此可以增强两个子任务预测结果之间的语义关联，从而达到提升子任务分类性能目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成式多任务学习模型的文本分类方法
本专利技术属于自然语言处理文本分类
，尤其涉及一种基于生成式多任务学习模型的文本分类方法。
技术介绍
文本多标签分类和层次分类是在实际应用中经常需要解决的问题，也是文本分类任务重要的两个分支以及当前的研究热点。在实际应用中许多数据具有多义性，一个实例可能对应标签集中的多个类别标签，文本多标签分类的目的就是为文本到标签集建立起一对多的关联。相对于传统的单标签分类，多标签分类是一种更符合真实应用场景的方法。比如在公安业务场景中，案件的受理过程会产生大量案件的警情文本，一般需要人工来标注标签，以方便理解和检索，从而为后续案件研判和侦破提供数据服务，例如，警情文本“被一外国女子以问路的方式诈骗，骗走一台vivo手机，价值1600元”对应“诈骗”和“涉外国人”两个标签。另外，实际应用中为了高效组织和管理海量文本数据，通常需要按照一个概念或主题将这些文本组织为层级分类目录，文本层次分类目的是在预定义的层级目录框架下为一个样本指定一条由多个层次标签组成的类别路径。例如，警情文本“被一外国女子以问路的方式诈骗，骗走一台vivo手机，价值1600元”中对应的层次类别路径为“诈骗类/接触型诈骗/名借实骗”。实际应用往往需要对一个文本既进行多标签分类，又进行层次分类。与传统的单分类任务相比，多标签分类和层次分类任务更加复杂，现有研究重点关注如何对样本到标签之间的一对多映射进行建模；同时，由于多标签分类任务中的标签往往存在较强的语义关系，而层次分类标签之间存在父子或兄弟关系，可以充分利用标签之间的语义关系来提高分类效果。针对文本多...

【技术保护点】
1.一种基于生成式多任务学习模型的文本分类方法，其特征在于，包括如下步骤：S1.对训练集中的各文本语料按照多标签分类和层次分类分别进行标定各自构建真实标签集；S2.基于多任务学习机制构建多任务分类模型，通过训练集根据共享编码器进行编码，根据多标签分类任务和层次分类任务交替对所述多任务分类模型进行解码并得到训练分类标签；S3.根据训练分类标签和真实标签计算损失值，并采用多标签分类任务和层次分类任务交替训练的方法对模型进行优化训练，获得优化分类模型；S4.将待测试集的各文本语料输入优化模型获得预测分类标签。

【技术特征摘要】
1.一种基于生成式多任务学习模型的文本分类方法，其特征在于，包括如下步骤：S1.对训练集中的各文本语料按照多标签分类和层次分类分别进行标定各自构建真实标签集；S2.基于多任务学习机制构建多任务分类模型，通过训练集根据共享编码器进行编码，根据多标签分类任务和层次分类任务交替对所述多任务分类模型进行解码并得到训练分类标签；S3.根据训练分类标签和真实标签计算损失值，并采用多标签分类任务和层次分类任务交替训练的方法对模型进行优化训练，获得优化分类模型；S4.将待测试集的各文本语料输入优化模型获得预测分类标签。2.如权利要求1所述的一种基于生成式多任务学习模型的文本分类方法，其特征在于，所述S2包括：S2.1.文本语料经预处理得到词嵌入矩阵，词嵌入矩阵中输入共享编码器，共享编码器利用双向长短记忆模型，根据词嵌入矩阵中对应当前时刻词嵌入向量以及当前时刻词嵌入向量的历史信息和未来信息得到当前时刻对应的特征向量，每一时刻对应的特征向量组成特征向量序列；S2.2.将所述特征向量输入多任务分类解码器，根据多标签分类任务和层次分类任务交替解码获得与编码时刻特征向量相关的当前时刻语义特征；S2.3.根据前一时刻语义特征、前一时刻输出对应完整标签集中标签的词嵌入向量以及前一时刻隐藏向量，获得当前时刻隐藏向量；S2.4.多标签分类任务根据当前时刻隐藏向量及当前时刻语义特征，层次分类任务根据当前时刻隐藏向量、当前时刻语义特征以及层级结构掩码矩阵，分别获得当前时刻在完整标签集上的概率分布，取最大值作为当前时刻的训练分类标签。3.如权利要求2所述的一种基于生成式多任务学习模型的文本分类方法，其特征在于，所述S2.2包括：多任务分类解码器中包括多标签分类注意力机制层和层次分类注意力机制层；多标签分类注意力机制层解码输出特征向量序列对应的多标签分类任务语义特征序列；层次分类注意力机制层解码输出特征向量序列对应的层次分类任务语义特征序列；其中语义特征序列由每一解码时刻按照先后顺序生成的语义特征组成。4.如权利要求2所述的一种基于生成式多任务学习模型的文本分类方法，其特征在于，所述S2.3中当前时刻隐藏向量获得的方法包括：S2.31，对多任务分类模型初始化，将多任务注意力机制层处理后得到的语义特征赋值给隐藏层的隐藏向量，并输入至多任务分类模型中的多任务分类器，其中多任务分类器包括多标签分类器和层次分类器，多任务分类器计算当前时刻语义特征在完整标签集上的概率分布，并输出概率最大值对应的分类标签；S2.32，将前一时刻的输出在完整标签集上的概率分布最大的分类标签、前一时刻的语义特征以及前一时刻的隐藏向量输入至多任务分类模型的长短记忆模型层，得到当前时刻的隐藏层对应的隐藏向量。5.如权利要求2...

【专利技术属性】
技术研发人员：谢松县，高辉，陈仲生，彭立宏，
申请(专利权)人：湖南数定智能科技有限公司，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人