训练分类模型和数据分类的方法和装置制造方法及图纸

技术编号：29676215 阅读：13 留言：0更新日期：2021-08-13 21:58

本公开的实施例公开了训练分类模型和数据分类的方法和装置。该方法的具体实施方式包括：执行以下训练步骤：从样本集中选取至少一个样本；基于概念表征网络提取每个样本的概念表征和每个类别的概念表征；根据每个样本的概念表征与其所属类别的概念表征的距离计算每个样本所属类别的预测概率；根据每个样本所属类别的预测概率和类别标签计算总损失值；若总损失值小于预定阈值，则基于概念表征网络构造分类模型。该实施方式能够从有限的标注样本中学习新类别的鲁棒、可信的知识。

全部详细技术资料下载

【技术实现步骤摘要】
训练分类模型和数据分类的方法和装置
本公开的实施例涉及计算机
，具体涉及训练分类模型和数据分类的方法和装置。
技术介绍
深度学习由于其优秀的数据学习能力、出色的任务执行性能，已经逐渐被应用到了人们生活、工作、学习的各个行业，比如人脸识别、商品检索等等。然而深度学习由于其模型的复杂性，往往需要海量的带有标签的针对某一任务采集的标注数据，来进行训练，才能获取性能稳定且置信度高的深度学习模型。然而，现实生活场景中，往往很难获取大量的带有标签的数据：1)部分场景中，比如商品检索场景，虽然有海量的商品数据，但是大部分商品数据并不具备直接的标注，而人工标注数据价格高、费时费力；2)部分场景中，比如医疗场景，部分疾病的数据很难采集大量的样本，比如罕见病可能只能收集一个病人的数据，导致数据多样性不足，无法利用这些数据训练获取泛化性能好的深度模型。
技术实现思路
本公开的实施例提出了训练分类模型和数据分类的方法和装置。第一方面，本公开的实施例提供了一种训练分类模型的方法，包括：执行以下训练步骤：从样本集中选取至少一个样本，其中，所述样本集中的样本具有类别标签；基于概念表征网络提取每个样本的概念表征和每个类别的概念表征；根据每个样本的概念表征与其所属类别的概念表征的距离计算每个样本所属类别的预测概率；根据每个样本所属类别的预测概率和类别标签计算总损失值；若总损失值小于预定阈值，则基于概念表征网络构造分类模型。在一些实施例中，该方法还包括：若总损失值不小于预定阈值，则调整概念表征网络的相关...

【技术保护点】
1.一种训练分类模型的方法，包括：执行以下训练步骤：/n从样本集中选取至少一个样本，其中，所述样本集中的样本具有类别标签；/n基于概念表征网络提取每个样本的概念表征和每个类别的概念表征；/n根据每个样本的概念表征与其所属类别的概念表征的距离计算每个样本所属类别的预测概率；/n根据每个样本所属类别的预测概率和类别标签计算总损失值；/n若所述总损失值小于预定阈值，则基于所述概念表征网络构造分类模型。/n

【技术特征摘要】
1.一种训练分类模型的方法，包括：执行以下训练步骤：
从样本集中选取至少一个样本，其中，所述样本集中的样本具有类别标签；
基于概念表征网络提取每个样本的概念表征和每个类别的概念表征；
根据每个样本的概念表征与其所属类别的概念表征的距离计算每个样本所属类别的预测概率；
根据每个样本所属类别的预测概率和类别标签计算总损失值；
若所述总损失值小于预定阈值，则基于所述概念表征网络构造分类模型。

2.根据权利要求1所述的方法，其中，所述方法还包括：
若所述总损失值不小于预定阈值，则调整所述概念表征网络的相关参数，继续执行所述训练步骤。

3.根据权利要求1所述的方法，其中，所述基于概念表征网络提取每个样本的概念表征和每个类别的概念表征，包括：
基于概念表征网络提取每个样本的概念表征；
将类别标签相同的样本的概念表征聚类，得到每个类别的概念表征。

4.根据权利要求3所述的方法，其中，所述概念表征网络包括特征提取网络、区域自注意力机制网络和概念聚合池化网络；以及
所述基于概念表征网络提取每个样本的概念表征，包括：
将所述至少一个样本分别输入特征提取网络，得到每个样本的区域特征；
将每个样本的区域特征分别输入区域自注意力机制网络，得到每个样本的增强区域特征；
将每个样本的增强区域特征分别输入概念聚合池化网络，得到每个样本的概念表征。

5.根据权利要求4所述的方法，其中，所述方法还包括：
根据所述样本集应用的领域的计算量选择网络层数与计算量正相关的特征提取网络。

6.根据权利要求4所述的方法，其中，所述将每个样本的区域特征分别输入区域自注意力机制网络，得到每个样本的增强区域特征，包括：
将每个样本的区域特征的位置信息分别进行编码，得到每个样本的位置编码；
将每个样本的区域特征分别计算全局平均特征，得到每个样本的全局上下文信息；
将每个样本的区域特征、位置编码和全局上下文信息构成每个样本的区域信息；
将每个样本的区域信息分别输入区域自注意力机制网络，得到每个样本的增强区域特征。

【专利技术属性】
技术研发人员：詹忆冰，韩梦雅，
申请(专利权)人：京东数科海益信息科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人