文本分类方法及装置、设备及介质制造方法及图纸

技术编号：27277200 阅读：18 留言：0更新日期：2021-02-06 11:43

本发明专利技术实施例提供的一种文本分类方法及装置、设备及介质，该方法包括：获取待分类文本；将所述待分类文本输入到Student集成模型，得到所述待分类文本的分类结果；其中，所述Student集成模型包括：N种Student模型，N种所述Student模型为各不相同的神经网络模型通过Teacher模型蒸馏得到的，在进行文本分类时，使用Student集成模型，而Student集成模型包括N种Student模型，从而能够基于不同算法的差异性，充分发挥各个模型优势，进而在节省计算资源的同时，提高分类模型预测的准确度。提高分类模型预测的准确度。提高分类模型预测的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
文本分类方法及装置、设备及介质

[0001]本专利技术涉及自然语言处理
，尤其涉及文本分类方法及装置、设备及介质。

技术介绍

[0002]深度学习在这几年的发展可谓是突飞猛进，为了提升模型性能，模型的参数量也变得越来越多，模型自身也变得越来越大。在自然语言处理领域(NLP)领域，BERT，GPT等超大模型的诞生也紧随其后。这些大型模型在准确率上大部分都比小参数模型要好，可是它们在部署阶段，往往需要占用巨大内存资源，同时运行起来也极其耗时，往往与工业界要求低资源、低延时的思想背道而驰，所以很多在学术界呼风唤雨的强大模型在企业的运用过程中却没有那么顺风顺水。
[0003]为解决上述问题，需要将参数量巨大的模型，压缩成小参数量模型，这样就可以在不失精度的情况下，使得模型占用资源少，运行快，所以如何将这些大模型压缩，同时保持住顶尖的准确率，成了学术界一个专门的研究领域。蒸馏，就是知识蒸馏，将教师网络(teacher network)的知识迁移到学生网络(student network)上，使得学生网络的性能表现如教师网络一般。这样学习来的小网络可以具备和大的复杂网络想接近的性能效果，并且也大大的节省了计算资源。这个复杂的网络可以看成一个教师，而小的网络则可以看成是一个学生。我们就可以愉快地将学生网络部署到移动手机和其它边缘设备上。
[0004]因此，如何在进行文本分类时，能够在节省计算资源的同时，提高分类模型预测的准确度是本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]本专...

【技术保护点】

【技术特征摘要】
1.一种文本分类方法，其特征在于，包括：获取待分类文本；将所述待分类文本输入到Student集成模型，得到所述待分类文本的分类结果；其中，所述Student集成模型包括：N种Student模型，N种所述Student模型为各不相同的神经网络模型通过Teacher模型蒸馏得到的。2.根据权利要求1所述的文本分类方法，其特征在于，当所述Teacher模型对N种所述Student模型进行的蒸馏时，N种所述Student模型的损失函数均为：Loss＝T*Mse(s,t)+a*Crossentropy(s,y)；其中，Loss为目标损失函数值，s为N种Student模型各自输出logits值；t为所述Teacher模型输出的logits值；T、a均为权重系数；y为进行蒸馏时的样本的真实标签。3.根据权利要求2所述的文本分类方法，其特征在于，T＝2，a＝1。4.根据权利要求1所述的文本分类方法，其特征在于，所述Student集成模型输出的结果为N种所述Student模型加权得到的。5.根据权利要求4所述的文本分类方法，其特征在于，N种所述Student模型包括：BILSTM分类模型、TEXTCNN分类模型以及RCNN分类模型中的至少两种。6.根据权利要求1至5任一项所述的文本分类方法，其特征在于，所述将所述待分类文本输入到Stud...

【专利技术属性】
技术研发人员：张乐乐，冯少辉，李鹏，
申请(专利权)人：北京中科智加科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人