迁移学习模型的确定方法、装置、设备及存储介质制造方法及图纸

技术编号：35068979 阅读：13 留言：0更新日期：2022-09-28 11:29

本申请公开了一种迁移学习模型的确定方法、装置、设备及存储介质，属于计算机与互联网技术领域。所述方法包括：从至少一个候选迁移学习模型中确定多个候选网络层；基于候选网络层对训练样本集合进行处理，得到样本编码信息熵和多个类别分别对应的类别编码信息熵；根据样本编码信息熵和多个类别编码信息熵，确定候选网络层的迁移率；基于各个候选网络层分别对应的迁移率，根据迁移率满足第一条件的候选网络层构建针对训练样本集合的迁移学习模型。本申请中，提供了一种在迁移学习之前评估迁移学习效果的方式，无需迁移学习即能够评估候选网络层对训练样本集合的迁移学习效果，以快速准确地确定针对训练样本集合的最优候选网络层。确地确定针对训练样本集合的最优候选网络层。确地确定针对训练样本集合的最优候选网络层。

全部详细技术资料下载

【技术实现步骤摘要】
迁移学习模型的确定方法、装置、设备及存储介质

[0001]本申请涉及计算机与互联网
，特别涉及一种迁移学习模型的确定方法、装置、设备及存储介质。

技术介绍

[0002]在模型学习过程中，通过迁移学习可以将某个任务开发的模型应用至其它任务的模型训练中。
[0003]目前，在迁移学习时，根据目标任务与源任务之间的关联关系，确定适用于目标任务的一个或多个迁移学习模型，之后，在存在多个迁移学习模型的情况下，采用该目标任务的训练样本集合分别对各个迁移学习模型进行训练，以得到适用于该目标任务的多个深度学习模型。之后，对该多个深度学习模型，通过测试确定各个深度学习模型的输出结果的准确率，以确定各个深度学习模型在本次迁移学习后的迁移学习效果，将准确率最高，即迁移学习效果最好的深度学习模型确定为目标任务最终的训练模型。
[0004]然而，在经过迁移学习得到深度学习模型后才能够对迁移学习效果进行评估，在存在多个迁移学习模型的情况下，无法快速确定目标任务对应的最优迁移学习模型。

技术实现思路

[0005]本申请实施例提供了一种迁移学习模型的确定方法、装置、设备及存储介质，提供了一种在迁移学习之前评估迁移学习效果的方式，能够快速准确地确定针对训练样本集合的最优候选网络层。所述技术方案如下。
[0006]根据本申请实施例的一个方面，提供了一种迁移学习模型的确定方法，所述方法包括以下步骤：
[0007]从至少一个候选迁移学习模型中确定多个候选网络层，一个候选迁移学习模型对应至少一个候选网络层...

【技术保护点】

【技术特征摘要】
1.一种迁移学习模型的确定方法，其特征在于，所述方法包括：从至少一个候选迁移学习模型中确定多个候选网络层，一个候选迁移学习模型对应至少一个候选网络层；其中，不同的候选迁移学习模型是基于不同的训练数据训练得到的模型；基于所述候选网络层对训练样本集合进行处理，得到样本编码信息熵和多个类别分别对应的类别编码信息熵，所述训练样本集合中包括属于不同类别的训练样本；其中，所述样本编码信息熵用于指示所述训练样本集合中的训练样本编码后所包含的信息量，所述类别对应的类别编码信息熵用于指示所述训练样本集合中属于所述类别的训练样本编码后所包含的信息量；根据所述样本编码信息熵和所述多个类别编码信息熵，确定所述候选网络层的迁移率，所述迁移率用于指示所述候选网络层针对所述训练样本集合的迁移学习效果；基于各个所述候选网络层分别对应的迁移率，根据迁移率满足第一条件的候选网络层构建针对所述训练样本集合的迁移学习模型。2.根据权利要求1所述的方法，其特征在于，所述基于所述候选网络层对训练样本集合进行处理，得到样本编码信息熵和多个类别分别对应的类别编码信息熵，包括：基于所述候选网络层对训练样本集合进行处理，得到样本特征矩阵和多个类别分别对应的类别特征矩阵；根据所述样本特征矩阵确定样本编码信息熵；根据各个所述类别对应的类别特征矩阵，确定各个所述类别分别对应的类别编码信息熵。3.根据权利要求2所述的方法，其特征在于，所述基于所述候选网络层对训练样本集合进行处理，得到样本特征矩阵和多个类别分别对应的类别特征矩阵，包括：基于所述候选网络层的特征提取函数，分别对所述训练样本集合中的各个训练样本进行处理，得到各个所述训练样本分别对应的特征向量；根据各个所述训练样本分别对应的特征向量，构建所述样本特征矩阵；其中，所述样本特征矩阵中第一目标列的数据为第一目标训练样本的特征向量；对于所述训练样本集合中属于目标类别的至少一个训练样本，根据属于所述目标类别的各个训练样本分别对应的特征向量，构建所述目标类别对应的类别特征矩阵；其中，所述目标类别对应的类别特征矩阵中第二目标列的数据为属于所述目标类别的第二目标训练样本的特征向量。4.根据权利要求2所述的方法，其特征在于，所述根据所述样本特征矩阵确定样本编码信息熵，包括：获取所述训练样本对应的特征向量的维度，以及针对所述训练样本的编码精确率；根据所述训练样本对应的特征向量的维度，以及针对所述训练样本的编码精确率，确定将所述样本特征矩阵压缩为所述编码精确率所指示的编码所需的编码长度；基于所述编码长度确定所述样本编码信息熵。5.根据权利要求1所述的方法，其特征在于，所述从至少一个候选迁移学习模型中确定多个候选网络层，包括：基于所述训练样本集合的训练任务，将与所述训练任务相关联的关联任务对应的训练
模型确定为所述候选迁移学习模型；对所述候选迁移学习模型包含的网络层进行采样，得到所述候选迁移学习模型对应的至少一个...

【专利技术属性】
技术研发人员：黄隆锴，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人