【技术实现步骤摘要】
一种基于迁移学习的文本分类模型获得方法及相关设备
[0001]本公开涉及文本处理
,尤其涉及一种基于迁移学习的文本分类模型获得方法及相关设备。
技术介绍
[0002]当前,大多采用分词器和对整个卷积神经网络进行训练进行文本分类。然而,与银行相关的业务文本不多,尤其可供于开发用的文本非常少。因此,在人工智能领域,若用数量极少的文本对卷积神经网络模型直接进行训练,收敛效果差,导致文本分类结果准确性低。
[0003]因此,如何利用较少的训练文本得到分类效果好的文本分类模型,成为本领域人员急需解决的技术问题。
技术实现思路
[0004]鉴于上述问题,本公开提供一种克服上述问题或者至少部分地解决上述问题的一种基于迁移学习的文本分类模型获得方法及相关设备,技术方案如下:
[0005]一种基于迁移学习的文本分类模型获得方法,包括:
[0006]构建初始文本分类模型,其中,所述初始文本分类模型由预先训练好的词向量模型和预先构建的卷积神经网络的全连接层构成,所述词向量模型的输出层与所述全连接层连接 ...
【技术保护点】
【技术特征摘要】
1.一种基于迁移学习的文本分类模型获得方法,其特征在于,包括:构建初始文本分类模型,其中,所述初始文本分类模型由预先训练好的词向量模型和预先构建的卷积神经网络的全连接层构成,所述词向量模型的输出层与所述全连接层连接;获得目标文本数据集,其中,所述目标文本数据集中包括至少一个携带有文本类别标签的目标文本;将所述目标文本数据集中的所述目标文本输入至所述初始文本分类模型中对所述全连接层进行分类训练,获得训练好的目标文本分类模型。2.根据权利要求1所述的方法,其特征在于,所述将所述目标文本数据集中的所述目标文本输入至所述初始文本分类模型中对所述全连接层进行分类训练,获得训练好的目标文本分类模型,包括:将所述目标文本数据集中的所述目标文本输入至所述初始文本分类模型中的所述词向量模型中,分别获得所述词向量模型输出的与各所述目标文本对应的文本向量矩阵;将各所述文本向量矩阵输入至所述全连接层中进行分类训练,获得已训练好所述全连接层的目标文本分类模型。3.根据权利要求1所述的方法,其特征在于,在所述获得目标文本数据集之前,所述方法还包括:获得原始文本数据集,其中,所述原始文本数据集中包括至少一个携带有文本类别标签的原始文本;根据所述词向量模型的输入要求,分别对所述原始文本数据集中的各所述原始文本进行预处理,生成目标文本数据集。4.根据权利要求3所述的方法,其特征在于,所述根据所述词向量模型的输入要求,分别对所述原始文本数据集中的各所述原始文本进行预处理,包括:对所述原始文本数据集中的各所述原始文本进行维度处理,获得满足所述词向量模型的输入维度要求的所述目标文本;将所述原始文本数据集中的各所述原始文本携带的所述文本类别标签进行格式处理...
【专利技术属性】
技术研发人员:徐梓丞,黄康,杨晓明,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。