文本分类方法和装置、服务器制造方法及图纸

技术编号:24169035 阅读:27 留言:0更新日期:2020-05-16 02:21
本说明书实施例提供一种文本分类方法和装置、服务器,通过特征提取能力相对低的第二文本分类模型输出第一训练文本的预测类别,再通过由第一训练文本以及第一训练文本的真实类别和预测类别训练出的第一文本分类模型对接收到的文本信息进行分类。由于第二文本分类模型的特征提取能力小于第一文本分类模型,因此,通过第二文本分类模型能够对第一文本分类模型进行约束,从而可以有效控制第一文本分类模型的过拟合,从而提高文本分类的准确性。

Text classification methods and devices, servers

【技术实现步骤摘要】
文本分类方法和装置、服务器
本说明书涉及人工智能
,尤其涉及文本分类方法和装置、服务器。
技术介绍
在日常应用中,常常需要对一些文本信息进行分类。例如,在智能机器人客服应用场景中,用户可以向智能机器人客服发送文本信息,该文本信息可以是与账户操作相关的文本信息,例如:“如何注册账户”或者“如何为账户绑定手机号”等;也可以是与订单相关的文本信息,例如:“如何取消订单”或者“取消订单退款处理时效是多久”等;还可以是其他类型的文本信息。为了提高智能机器人客服的应答效率,需要对此类文本信息进行分类。因此,有必要提高文本信息分类的准确性。
技术实现思路
基于此,本说明书实施例提供了文本分类方法和装置、服务器。根据本说明书实施例的第一方面,提供一种文本分类方法,所述方法包括:接收文本信息;通过预先训练的第一文本分类模型对所述文本信息进行分类,以确定所述文本信息所属的类别;其中,所述第一文本分类模型基于第一训练文本、所述第一训练文本的真实类别,以及由预先训练的第二文本分类模型输出的所述第一训练文本的第一本文档来自技高网...

【技术保护点】
1.一种文本分类方法,所述方法包括:/n接收文本信息;/n通过预先训练的第一文本分类模型对所述文本信息进行分类,以确定所述文本信息所属的类别;/n其中,所述第一文本分类模型基于第一训练文本、所述第一训练文本的真实类别,以及由预先训练的第二文本分类模型输出的所述第一训练文本的第一预测类别训练得到,且所述第二文本分类模型的特征提取能力低于所述第一文本分类模型的特征提取能力。/n

【技术特征摘要】
1.一种文本分类方法,所述方法包括:
接收文本信息;
通过预先训练的第一文本分类模型对所述文本信息进行分类,以确定所述文本信息所属的类别;
其中,所述第一文本分类模型基于第一训练文本、所述第一训练文本的真实类别,以及由预先训练的第二文本分类模型输出的所述第一训练文本的第一预测类别训练得到,且所述第二文本分类模型的特征提取能力低于所述第一文本分类模型的特征提取能力。


2.根据权利要求1所述的方法,所述第一文本分类模型通过以下方式训练得到:
将所述第一训练文本输入所述第二文本分类模型,获取所述第一预测类别;
将所述第一训练文本作为第一文本分类模型的输入,并将所述第一训练文本的真实类别和所述第一预测类别共同作为所述第一文本分类模型的输出,以训练所述第一文本分类模型。


3.根据权利要求2所述的方法,所述方法还包括:
若不满足预设的训练终止条件,将所述第一文本分类模型作为所述第二文本分类模型,重新训练第一文本分类模型。


4.根据权利要求1所述的方法,所述第二文本分类模型通过以下方式训练得到:
将第二训练文本作为所述第二文本分类模型的输入,将所述第二训练文本的真实类别作为所述第二文本分类模型的输出,以训练所述第二文本分类模型。


5.根据权利要求1所述的方法,所述第一文本分类模型输出的所述第一训练文本的第二预测类别满足预设的第一损失函数,所述第一预测类别满足预设的第二损失函数。


6.根据权利要求1所述的方法,将所述第一训练文本作为第一文本分类模型的输入,并将所述第一训练文本的真实...

【专利技术属性】
技术研发人员:马良庄
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1