文本分类模型的训练方法、装置、设备及介质制造方法及图纸

技术编号:41978064 阅读:22 留言:0更新日期:2024-07-12 12:10
本发明专利技术涉及人工智能领域,揭露一种文本分类模型的训练方法、装置、电子设备及存储介质,可用于对金融保险的说明书文本进行文本标签分类,所述方法包括:获取分词训练文本及所述分词训练文本对应的文本标签,并根据预设规则构建所述分词训练文本的正样本文本及负样本文本;根据所述分词训练文本、正样本文本及负样本文本,对预设文本分类模型进行初步训练,得到初步训练完成的文本分类模型;利用所述初步训练完成的文本分类模型提取所述分词训练文本的特征向量,得到分词文本特征向量;根据所述分词文本特征向量,对所述初步训练完成的文本分类模型中的多层感知机模块进行训练,得到训练完成的文本分类模型。本发明专利技术可以提高文本分类模型的精准度。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,尤其涉及一种文本分类模型的训练方法、装置、电子设备及可读存储介质。


技术介绍

1、文本分类指的是按照事先定好的规则识别任意文本的类别,例如,在金融领域,可以将各种保险的文件说明文本按照给定的不同的标签进行分类,从而使得文件查找更为便捷。

2、目前常见的文本分类模型的训练方法多为将同一标签对应多个文本数据作为一个训练集合进行模型训练,使得模型能够学习当前标签对应的多个文本数据的共通性,从而得到训练完成的文本分类模型,例如,在金融领域中,通过对多个已知类别的保险说明文本进行模型训练,得到训练完成的文本分类模型,并使用训练完成的文本分类模型对未知类别的保险说明文本进行分类,但是这种训练方法在遇到文本内容较为相似,但标签略有不同的保险说明文本时,由于模型的泛化能力,从而容易造成这些保险说明文本具有相似的标签,使得文本分类模型的精准度不高。


技术实现思路

1、本专利技术提供一种文本分类模型的训练方法、装置、电子设备及可读存储介质,有效地提高了金融文本分类的便捷性及准确率,其目的在本文档来自技高网...

【技术保护点】

1.一种文本分类模型的训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的文本分类模型的训练方法,其特征在于,所述利用预设文本分类模型分别预测所述分词训练文本与所述正样本文本及所述负样本文本的文本相似度,包括:

3.如权利要求2所述的文本分类模型的训练方法,其特征在于,所述利用所述预设文本分类模型中的多层感知机模块分别计算所述分词文本分类标识符编码向量与所述正样本分类标识符编码向量及所述负样本分类标识符编码向量的相似度,得到所述分词训练文本与所述正样本文本及所述负样本文本的文本相似度,包括:

4.如权利要求1所述的文本分类模型的训练方法,其特征...

【技术特征摘要】

1.一种文本分类模型的训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的文本分类模型的训练方法,其特征在于,所述利用预设文本分类模型分别预测所述分词训练文本与所述正样本文本及所述负样本文本的文本相似度,包括:

3.如权利要求2所述的文本分类模型的训练方法,其特征在于,所述利用所述预设文本分类模型中的多层感知机模块分别计算所述分词文本分类标识符编码向量与所述正样本分类标识符编码向量及所述负样本分类标识符编码向量的相似度,得到所述分词训练文本与所述正样本文本及所述负样本文本的文本相似度,包括:

4.如权利要求1所述的文本分类模型的训练方法,其特征在于,所述根据预设规则构建所述分词训练文本的正样本文本及负样本文本,包括:

5.如权利要求4所述的文本分类模型的训练方法,其特征...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1