分类神经网络的训练方法、文本分类方法、装置及设备制造方法及图纸

技术编号:25044385 阅读:22 留言:0更新日期:2020-07-29 05:34
本公开是关于一种分类神经网络的训练方法、文本分类方法、装置及设备,所述分类神经网络的训练方法,包括基于以下步骤训练目标神经网络:获取样本文本数据的回归结果,所述回归结果基于预先构建的第一目标神经网络确定,用于表征所述样本文本数据的分类趋势;将所述样本文本数据和对应的回归结果输入至第二目标神经网络;根据第二目标神经网络获得每个所述样本文本数据的预测分类结果;根据每个样本文本数据的预测分类结果与对应类别真实值的差异对所述第二目标卷积神经网络的参数进行调整;在网络损失的变化满足收敛条件后,得到完成训练的第二目标神经网络。本公开可以实现更好的训练第二目标神经网络,提高后续进行文本数据分类的准确性。

【技术实现步骤摘要】
分类神经网络的训练方法、文本分类方法、装置及设备
本公开涉及数据处理
,尤其涉及一种分类神经网络的训练方法、文本分类方法、装置及设备。
技术介绍
相关技术中可以基于神经网络来实现文本分类,然而其需要遵循一个基本假设,即类别之间基本没有关联。这就导致对于一种类别之间有趋势关系的数据,比如“优、良、差”,不能实现准确的分类;另一方面,相关技术中的分类方案假设分类问题的数据之间是平等的,即不会关注某一部分数据的对错,只确保整体准确率高即可,这就会导致某些关键数据的分类准确性较低。
技术实现思路
为克服相关技术中存在的问题,本公开实施例提供一种分类神经网络的训练方法、文本分类方法、装置及设备,用以解决相关技术中的缺陷。根据本公开实施例的第一方面,提供一种分类神经网络的训练方法,包括基于以下步骤训练目标神经网络:获取样本文本数据的回归结果,所述回归结果基于预先构建的第一目标神经网络确定,用于表征所述样本文本数据的分类趋势;将所述样本文本数据和对应的回归结果输入至第二目标神经网络;根据所述第二目标神经网络获得每个所本文档来自技高网...

【技术保护点】
1.一种分类神经网络的训练方法,其特征在于,包括基于以下步骤训练目标神经网络:/n获取样本文本数据的回归结果,所述回归结果基于预先构建的第一目标神经网络确定,用于表征所述样本文本数据的分类趋势;/n将所述样本文本数据和对应的回归结果输入至第二目标神经网络;/n根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果;/n根据每个所述样本文本数据的预测分类结果与对应类别真实值的差异对所述第二目标卷积神经网络的参数进行调整;/n在网络损失的变化满足收敛条件后,得到完成训练的第二目标神经网络。/n

【技术特征摘要】
1.一种分类神经网络的训练方法,其特征在于,包括基于以下步骤训练目标神经网络:
获取样本文本数据的回归结果,所述回归结果基于预先构建的第一目标神经网络确定,用于表征所述样本文本数据的分类趋势;
将所述样本文本数据和对应的回归结果输入至第二目标神经网络;
根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果;
根据每个所述样本文本数据的预测分类结果与对应类别真实值的差异对所述第二目标卷积神经网络的参数进行调整;
在网络损失的变化满足收敛条件后,得到完成训练的第二目标神经网络。


2.根据权利要求1所述的方法,其特征在于,所述将所述样本文本数据和对应的回归结果输入至第二目标神经网络,包括:
将所述样本文本数据输入至第二目标神经网络,得到样本文本向量;
将所述样本文件数据对应的回归结果作为所述样本文本向量的新增维度,与所述样本文本向量进行拼接,生成新的样本文本向量;
所述根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果,包括:
基于所述新的样本文本向量,根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果。


3.根据权利要求1所述的方法,其特征在于,所述将所述样本文本数据和对应的回归结果输入至第二目标神经网络,包括:
确定对应回归结果为目标回归结果的第一样本文本数据;
增大所述第一样本文本数据在训练过程中的权重,以增加所述第一样本文本数据的损失对整体损失的影响;
所述根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果,包括:
基于增大所述第一样本文本数据权重后的样本文本数据,根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括基于以下步骤训练所述第一目标神经网络:
将所述样本文本数据输入至所述第一目标神经网络,所述样本数据标注有回归结果的真实值;
根据所述第一目标神经网络得到所述样本文本数据的回归结果;
根据所述回归结果与所述回归结果的真实值的差异,对所述第一目标神经网络的参数进行调整;
在网络损失函数的变化满足收敛条件后,得到完成训练的第一目标神经网络。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括基于以下步骤训练所述第一目标神经网络:
将所述样本文本数据输入至所述第一目标神经网络,所述样本文本数据标注有类别的真实值和回归结果的真实值;
通过所述第一目标神经网络中的核心网络对所述样本文本数据进行特征提取,得到特征提取结果;
将所述特征提取结果分别输入分类网络分支和回归网络分支;
通过所述分类网络分支预测所述样本文本数据的中间分类结果,以及通过所述回归网络分支预测所述样本文本数据的回归结果;
根据所述中间分类结果与所述类别的真实值的第一差异对所述分类网络分支以及所述核心网络的参数进行调整;
根据所述回归结果与所述回归结果的真实值的第二差异,对所述回归网络分支以及所述核心网络的参数进行调整;
在所述分类网络分支的网络损失以及所述回归网络分支的网络损失的变化满足收敛条件后,得到完成训练的第一目标神经网络。


6.一种文本分类方法,其特征在于,包括:
将待分类文本数据输入第一目标神经网络,得到所述待分类文本数据的回归结果;
将所述待分类文本数据和所述回归结果输入所述第二目标神经网络,得到所述待分类文本数据的目标分类结果。


7.一种分类神经网络的训练装置,其特征在于,包括第二网络训练模块;
所述第二网络训练模块,包括:
回归结果获取单元,用于获取样本文本数据的回归结果,所述回归结果基于预先构建的第一目标神经网络确定,用于表征所述样本文本数据的分类趋势;
数据结果输入单元,用于将所述样本文本数据和对应的回归结果输入至第二目标神经网络;
预...

【专利技术属性】
技术研发人员:徐泽宇孟二利孙磊
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1