一种模型的监督训练方法、装置及设备制造方法及图纸

技术编号：29587335 阅读：14 留言：0更新日期：2021-08-06 19:46

本说明书实施例公开了一种模型的监督训练方法、装置及设备，该方法包括：获取用于训练预设模型的样本数据，并对所述样本数据进行特征提取，得到每个所述样本数据对应的特征向量；使用预设的字典学习算法，并基于每个所述样本数据对应的特征向量、预设的字典矩阵和待确定的每个所述样本数据对应的类别构建的优化目标，对每个所述样本数据进行分类，得到每个所述样本数据对应的类别，所述字典矩阵由预设的用于构建样本数据类别的多个基向量构建；基于每个所述样本数据对应的特征向量和每个所述样本数据对应的类别对所述预设模型进行监督训练。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型的监督训练方法、装置及设备
本说明书涉及计算机
，尤其涉及一种模型的监督训练方法、装置及设备。
技术介绍
在工业应用中，通过有监督的训练得到的一些网络模型已有较多应用，但在模型训练的实际应用中，由于标注数据的稀缺，通常模型无法实现在大规模标注数据的条件下进行监督训练，从而导致该模型的实际应用效果很差。此外，通过有监督训练得到的模型无法提取通用的样本数据表征，从而使得技术人员必须针对不同的场景训练不同的模型，进而造成了模型的重复开发，浪费了大量的计算资源。为此，需要提供一种模型训练的监督机制并以此来训练相应的模型的技术方案。
技术实现思路
本说明书实施例的目的是提供一种模型训练的监督机制并以此来训练相应的模型。为了实现上述技术方案，本说明书实施例是这样实现的：本说明书实施例提供的一种模型的监督训练方法，所述方法包括：获取用于训练预设模型的样本数据，并对所述样本数据进行特征提取，得到每个所述样本数据对应的特征向量。使用预设的字典学习算法，并基于每个所述样本数据对应的特征向量、预设的字典矩阵和待确定的每个所述样本数据对应的类别构建的优化目标，对每个所述样本数据进行分类，得到每个所述样本数据对应的类别，所述字典矩阵由预设的用于构建样本数据类别的多个基向量构建。基于每个所述样本数据对应的特征向量和每个所述样本数据对应的类别对所述预设模型进行监督训练。本说明书实施例提供的一种模型的监督训练装置，所述装置包括：样本处理模块，获取用于训练预设模型的样本数据，并对所述样...

【技术保护点】
1.一种模型的监督训练方法，所述方法包括：/n获取用于训练预设模型的样本数据，并对所述样本数据进行特征提取，得到每个所述样本数据对应的特征向量；/n使用预设的字典学习算法，并基于每个所述样本数据对应的特征向量、预设的字典矩阵和待确定的每个所述样本数据对应的类别构建的优化目标，对每个所述样本数据进行分类，得到每个所述样本数据对应的类别，所述字典矩阵由预设的用于构建样本数据类别的多个基向量构建；/n基于每个所述样本数据对应的特征向量和每个所述样本数据对应的类别对所述预设模型进行监督训练。/n

【技术特征摘要】
1.一种模型的监督训练方法，所述方法包括：
获取用于训练预设模型的样本数据，并对所述样本数据进行特征提取，得到每个所述样本数据对应的特征向量；
使用预设的字典学习算法，并基于每个所述样本数据对应的特征向量、预设的字典矩阵和待确定的每个所述样本数据对应的类别构建的优化目标，对每个所述样本数据进行分类，得到每个所述样本数据对应的类别，所述字典矩阵由预设的用于构建样本数据类别的多个基向量构建；
基于每个所述样本数据对应的特征向量和每个所述样本数据对应的类别对所述预设模型进行监督训练。

2.根据权利要求1所述的方法，所述预设模型为神经网络模型。

3.根据权利要求2所述的方法，所述使用预设的字典学习算法，并基于每个所述样本数据对应的特征向量、预设的字典矩阵和待确定的每个所述样本数据对应的类别构建的优化目标，对每个所述样本数据进行分类，得到每个所述样本数据对应的类别，包括：
使用预设的字典学习算法，并基于每个所述样本数据对应的特征向量、预设的字典矩阵和待确定的每个所述样本数据对应的类别的向量构建的优化目标，对每个所述样本数据进行分类，得到每个所述样本数据对应的类别的向量；
对每个所述样本数据对应的类别的向量进行二值化处理，得到二值化后的所述类别的向量；
基于二值化后的所述类别的向量确定每个所述样本数据对应的类别。

4.根据权利要求3所述的方法，所述每个所述样本数据对应的类别的向量为稀疏向量。

5.根据权利要求3所述的方法，构建的所述优化目标为

其中，D为字典矩阵，所述字典矩阵由k个基向量di(i＝1,2,…,k)组成，N为样本数据的数量，xn为第n个样本数据，为待确定的第n个所述样本数据对应的类别的向量，fθ(xn)为第n个所述样本数据对应的特征向量，N个样本数据对应的类别的数量为k，θ为模型参数，λ为预设参数。

6.根据权利要求3所述的方法，所述基于每个所述样本数据对应的特征向量和每个所述样本数据对应的类别对所述预设模型进行监督训练，包括：
基于每个所述样本数据对应的特征向量和每个所述样本数据对应的类别对所述预设模型进行监督训练的过程中，基于反向传播算法确定所述预设模型的模型参数和预设分类器的分类器参数；
基于所述预设模型的模型参数和预设分类器的分类器参数，通过梯度下降优化分类损失函数对所述预设模型进行监督训练。

7.根据权利要求6所述的方法，所述梯度下降优化分类损失函数为

其中，l为逻辑回归分类损失函数，W＝[w1,w2,....wj]表示预设分类器，wj为第j个预设分类器的分类器参数。

8.一种模型的监督训练装置，所述装置包括：
样本处理模块，获取用于训练预设模型的样本数据，并对所述样本数据进行特征提取，...

【专利技术属性】
技术研发人员：吕乐，周璟，刘佳，尚田丰，傅幸，杨阳，王维强，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人