一种分类模型构建方法、装置及存储介质制造方法及图纸

技术编号：38320873 阅读：10 留言：0更新日期：2023-07-29 09:02

本发明专利技术提供一种分类模型构建方法、装置及存储介质，涉及自然语言处理技术领域，所述方法包括：基于获取的多个预训练模型对训练数据集进行向量化，得到多个预训练模型分别对应的向量化数据；根据多个预训练模型中每个预训练模型对应的向量化数据，在多个预训练模型中确定目标预训练模型；基于目标预训练模型，构建分类模型。多个预训练模型对训练数据集进行向量化，以获取多个预训练模型分别对应的向量化数据，根据每个预训练模型对应的向量化数据，在多个预训练模型中确定目标预训练模型，基于目标预训练模型构建分类模型。通过每个预训练模型对应的向量化数据对多个预训练模型进行筛选，优化了模型训练的过程，从而提升了训练效率。效率。效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种分类模型构建方法、装置及存储介质

[0001]本专利技术涉及自然语言处理
，尤其涉及一种分类模型构建方法、装置及存储介质。

技术介绍

[0002]在自然语言处理（Natural Language Processing，NLP）技术中，通常需要用到分类模型，以对进行识别任务（例如意图识别、情感识别等）。目前，得到一个分类模型，通常是先对多个预训练模型进行训练，以得到多个分类模型，并在这多个分类模型中选择出满足需求的分类模型。由于预训练模型种类繁多，这种先对多个预训练模型进行训练，再去评判分类模型优劣的方式，存在分类模型构建效率较低的问题。

技术实现思路

[0003]本专利技术实施例提供一种分类模型构建方法、装置及存储介质，以解决现有的模型构建方法效率较低的问题。
[0004]本专利技术实施例提供了一种分类模型构建方法，所述方法包括：基于获取的多个预训练模型对训练数据集进行向量化，得到所述多个预训练模型分别对应的向量化数据；根据所述多个预训练模型中每个预训练模型对应的向量化数据，在所述多个预训练模型中确定目标预训练模型；基于所述目标预训练模型，构建分类模型。
[0005]可选地，所述根据所述多个预训练模型中每个预训练模型对应的向量化数据，在所述多个预训练模型中确定目标预训练模型，包括：根据所述训练数据集的特征信息与所述多个预训练模型中每个预训练模型对应的向量化数据的特征信息，在所述多个预训练模型中确定第一目标预训练模型；和/或，根据所述多个预训练模型的损失函数，在所述多个预训练模...

【技术保护点】

【技术特征摘要】
1.一种分类模型构建方法，其特征在于，所述方法包括：基于获取的多个预训练模型对训练数据集进行向量化，得到所述多个预训练模型分别对应的向量化数据；根据所述多个预训练模型中每个预训练模型对应的向量化数据，在所述多个预训练模型中确定目标预训练模型；基于所述目标预训练模型，构建分类模型。2.根据权利要求1所述的方法，其特征在于，所述根据所述多个预训练模型中每个预训练模型对应的向量化数据，在所述多个预训练模型中确定目标预训练模型，包括：根据所述训练数据集的特征信息与所述多个预训练模型中每个预训练模型对应的向量化数据的特征信息，在所述多个预训练模型中确定第一目标预训练模型；和/或，根据所述多个预训练模型的损失函数，在所述多个预训练模型中确定第二目标预训练模型，所述多个预训练模型的损失函数为基于所述多个预训练模型中每个预训练模型对应的向量化数据分别计算得到的损失函数；其中，所述第一目标预训练模型与所述第二目标预训练模型相同或不相同。3.根据权利要求2所述的方法，其特征在于，所述根据所述训练数据集的特征信息与所述多个预训练模型中每个预训练模型对应的向量化数据的特征信息，在所述多个预训练模型中确定第一目标预训练模型，包括：根据所述训练数据集的特征信息，确定所述训练数据集的特征空间分布；根据所述多个预训练模型中每个预训练模型对应的向量化数据的特征信息，确定每个预训练模型对应的向量化数据的特征空间分布；根据所述训练数据集的特征空间分布与每个预训练模型对应的向量化数据的特征空间分布，在所述多个预训练模型中确定第一目标预训练模型。4.根据权利要求3所述的方法，其特征在于，所述根据所述多个预训练模型中每个预训练模型对应的向量化数据的特征信息，确定每个预训练模型对应的向量化数据的特征空间分布，包括：利用无监督算法对所述多个预训练模型中每个预训练模型对应的向量化数据的特征信息进行降维，...

【专利技术属性】
技术研发人员：贾敬伍，张杰，于皓，
申请(专利权)人：北京中关村科金技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人