目标分类的方法和装置制造方法及图纸

技术编号：28873025 阅读：39 留言：0更新日期：2021-06-15 23:06

本发明专利技术公开了目标分类的方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：利用标记样本集进行模型训练，得到老师模型；所述标记样本集包括多个标记样本及其分类标签；基于所述老师模型确定未标记样本集中每个未标记样本的分类标签和不确定度，得到伪标记样本集；利用所述标记样本集和所述伪标记样本集，采用所述老师模型的网络结构进行模型训练，得到多分类模型；基于所述多分类模型确定待分类目标的分类标签。该实施方式能够在有限标签数据的情况下增加大量实际可用的伪标签数据，以改进训练处的模型的性能，提高分类模型的稳定性和精度。

全部详细技术资料下载

【技术实现步骤摘要】
目标分类的方法和装置
本专利技术涉及计算机
，尤其涉及一种目标分类的方法和装置。
技术介绍
目前通常采用深度学习模型进行数据分类。在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：深度学习模型需要大量的标记数据来实现合理的稳定性和精度，然而在实际工业中，标注正确的数据往往较难得到，存在的更多的是大量未标记的数据。在这种工业环境下，训练监督的深度学习方法时，常见的问题是缺乏标记的数据。
技术实现思路
有鉴于此，本专利技术实施例提供一种目标分类的方法和装置，能够在有限标签数据的情况下增加大量实际可用的伪标签数据，以改进训练处的模型的性能，提高分类模型的稳定性和精度。为实现上述目的，根据本专利技术实施例的一个方面，提供了一种目标分类的方法，包括：利用标记样本集进行模型训练，得到老师模型；所述标记样本集包括多个标记样本及其分类标签；基于所述老师模型确定未标记样本集中每个未标记样本的分类标签和不确定度，得到伪标记样本集；利用所述标记样本集和所述伪标记样本...

【技术保护点】
1.一种目标分类的方法，其特征在于，包括：/n利用标记样本集进行模型训练，得到老师模型；所述标记样本集包括多个标记样本及其分类标签；/n基于所述老师模型确定未标记样本集中每个未标记样本的分类标签和不确定度，得到伪标记样本集；/n利用所述标记样本集和所述伪标记样本集，采用所述老师模型的网络结构进行模型训练，得到多分类模型；/n基于所述多分类模型确定待分类目标的分类标签。/n

【技术特征摘要】
1.一种目标分类的方法，其特征在于，包括：
利用标记样本集进行模型训练，得到老师模型；所述标记样本集包括多个标记样本及其分类标签；
基于所述老师模型确定未标记样本集中每个未标记样本的分类标签和不确定度，得到伪标记样本集；
利用所述标记样本集和所述伪标记样本集，采用所述老师模型的网络结构进行模型训练，得到多分类模型；
基于所述多分类模型确定待分类目标的分类标签。

2.如权利要求1所述的方法，其特征在于，利用标记样本集进行模型训练，包括：利用所述标记样本集，基于贝叶斯算法进行模型训练。

3.如权利要求1所述的方法，其特征在于，基于所述老师模型确定未标记样本集中每个未标记样本的分类标签和不确定度，包括：基于所述老师模型，采用随机失活方法确定所述未标记样本集中每个未标记样本的分类标签和不确定度。

4.如权利要求1所述的方法，其特征在于，利用所述标记样本集和所述伪标记样本集进行模型训练，得到多分类模型，包括：
A、利用所述标记样本集和所述伪标记样本集进行模型训练，得到学生模型；
B、将所述标记样本集和所述未标记样本集分别输入所述学生模型，得到所述标记样本集的标注结果和所述未标记样本集的标注结果；根据所述标记样本集的标注结果和所述未标记样本集的标注结果确定所述学生模型的损失函数是否收敛；若是，则以所述学生模型作为所述多分类模型；否则跳转至步骤C；
C、调整所述学生模型的模型参数，然后迭代执行步骤B，直至所述学生模型的损失函数收敛，得到多分类模型。

5.一种目标分类的装置，其特征在于，包括：
老师模型训练单元，利用标记样本集进行模型训练，得到老师模型；所述标记样本集包括多个标记样本及其分类标签；
预测单元，基于所述老师模型确定未标记样本集中每个未标记样本的分类标签和不确定度，...

【专利技术属性】
技术研发人员：刘义明，
申请(专利权)人：北京沃东天骏信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人