基于特征编码器的训练方法及装置、分类方法及装置制造方法及图纸

技术编号：26791161 阅读：26 留言：0更新日期：2020-12-22 17:06

本说明书实施例提供了一种基于特征编码器的训练方法及装置、分类方法及装置。在该方法中，获取当前训练样本，将当前训练样本以及用于分类的多个文本类别分别输入特征编码器，输出各个当前训练样本对应的样本特征向量以及多个文本类别对应的分类矩阵；基于输出的样本特征向量以及分类矩阵得到当前训练样本针对各个文本类别的预测值；以及在不满足循环结束条件时，根据所得到的预测值和当前训练样本的真实分类类别对特征编码器的编码器参数进行调整，调整后的特征编码器作为下一次循环的特征编码器。

全部详细技术资料下载

【技术实现步骤摘要】
基于特征编码器的训练方法及装置、分类方法及装置
本说明书实施例涉及机器学习
，具体地，涉及基于特征编码器的训练方法及装置、分类方法及装置。
技术介绍
分类模型是一种常见的机器学习模型，并且广泛应用于各个领域中。分类模型可以分为基于规则的分类模型和基于概率统计的分类模型。在基于规则的分类模型中，使用若干规则来区分各个类别，规则可以是通过领域专家来定义或者通过机器学习来获得，比如，决策树是一种基于机器学习的分类模型。基于概率统计的分类模型是预测待分类对象针对每个指定类别的概率，然后输出概率最大的类别以作为该待分类对象的预测类别。比如，softmax分类是一种常见的基于概率统计的分类。
技术实现思路
鉴于上述，本说明书实施例提供了一种基于特征编码器的训练方法及装置、分类方法及装置。在训练的技术方案中，通过使用特征编码器来得到文本类别对应的分类矩阵，从而仅需对特征编码器的参数进行训练，避免训练整个分类矩阵，通常情况下分类矩阵对应的分类类别较多导致分类矩阵所需训练的参数多，特征编码器的训练参数少于分类...

【技术保护点】
1.一种用于对输出分类矩阵的特征编码器进行训练的方法，包括：/n执行下述循环训练过程，直至满足循环结束条件：/n获取用于当前循环的当前训练样本；/n将所述当前训练样本以及用于分类的多个文本类别分别输入待训练的特征编码器，输出各个当前训练样本对应的样本特征向量以及所述多个文本类别对应的分类矩阵，其中，所述分类矩阵由输入所述特征编码器的各个文本类别对应的类别特征向量构成；/n基于输出的样本特征向量以及分类矩阵得到所述当前训练样本针对各个文本类别的预测值；以及/n在不满足所述循环结束条件时，根据所得到的预测值和所述当前训练样本的真实分类类别对所述特征编码器的编码器参数进行调整，调整后的特征编码器作为...

【技术特征摘要】
1.一种用于对输出分类矩阵的特征编码器进行训练的方法，包括：
执行下述循环训练过程，直至满足循环结束条件：
获取用于当前循环的当前训练样本；
将所述当前训练样本以及用于分类的多个文本类别分别输入待训练的特征编码器，输出各个当前训练样本对应的样本特征向量以及所述多个文本类别对应的分类矩阵，其中，所述分类矩阵由输入所述特征编码器的各个文本类别对应的类别特征向量构成；
基于输出的样本特征向量以及分类矩阵得到所述当前训练样本针对各个文本类别的预测值；以及
在不满足所述循环结束条件时，根据所得到的预测值和所述当前训练样本的真实分类类别对所述特征编码器的编码器参数进行调整，调整后的特征编码器作为下一次循环的特征编码器。

2.如权利要求1所述的方法，还包括：
针对每个当前训练样本，从文本类别库中确定与该当前训练样本匹配的指定数量的文本类别；以及
将所述当前训练样本以及用于分类的多个文本类别分别输入待训练的特征编码器，输出各个当前训练样本对应的样本特征向量以及所述多个文本类别对应的分类矩阵包括：
将所述当前训练样本以及所确定的文本类别分别输入待训练的特征编码器，得到各个当前训练样本对应的样本特征向量以及所确定的文本类别对应的分类矩阵。

3.如权利要求2所述的方法，其中，针对每个当前训练样本，从文本类别库中确定与该当前训练样本匹配的指定数量的文本类别包括：
针对每个当前训练样本，使用召回算法从文本类别库中确定与该当前训练样本匹配的指定数量的文本类别。

4.如权利要求2所述的方法，其中，基于输出的样本特征向量以及分类矩阵得到所述当前训练样本针对各个文本类别的预测值包括：
基于输出的样本特征向量、分类矩阵以及所确定的文本类别对应的偏置矩阵得到所述当前训练样本针对所确定的各个文本类别的预测值；以及
在不满足所述循环结束条件时，根据所得到的预测值和所述当前训练样本的真实分类类别对所述特征编码器的编码器参数进行调整包括：
在不满足所述循环结束条件时，根据所得到的预测值和所述当前训练样本的真实分类类别对所述特征编码器的编码器参数以及所述偏置矩阵进行调整。

5.如权利要求2所述的方法，其中，训练使用的所有训练样本对应的真实分类类别包括所述文本类别库中的全部或者大部分类别。

6.如权利要求2所述的方法，还包括：
在所述当前训练样本有多个时，对所确定的所有文本类别进行去重处理。

7.如权利要求1所述的方法，其中，所述循环结束条件包括：针对所述训练使用的全部训练样本的迭代次数达到指定次数，和/或针对所述训练使用的全部训练样本的预测准确率不再上升。

8.一种使用特征编码器进行文本分类的方法，包括：
获取待分类文本；
从文本类别库中确定与所述待分类文本匹配的指定数量的文本类别；
将所述待分类文本和所确定的文本类别输入经过训练的特征编码器，输出所述待分类文本对应的特征向量以及所述文本类别对应的分类矩阵，其中，所述分类矩阵由各个文本类别...

【专利技术属性】
技术研发人员：陈晓军，崔恒斌，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人