基于知识迁移进行模型训练的方法及装置制造方法及图纸

技术编号：39314429 阅读：10 留言：0更新日期：2023-11-12 15:58

本说明书实施例提供了基于知识迁移进行模型训练的方法及装置。在该方法中，可以获取不同场景的场景数据；然后根据所获取的场景数据学习各个场景之间的关联性，以得到各个场景对应的迁移权重，其中，每个场景对应的迁移权重用于表征该场景与其他场景之间的关联性特征；以及利用知识蒸馏根据各个场景对应的迁移权重在由场景数据训练得到的通用模型与各个场景对应的子模型之间进行知识迁移，以得到各个场景的子模型。个场景的子模型。个场景的子模型。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识迁移进行模型训练的方法及装置

[0001]本说明书实施例涉及人工智能
，具体地，涉及基于知识迁移进行模型训练的方法及装置。

技术介绍

[0002]在目前的工业环境中，可以包括有多种不同的场景，不同场景中的数据和交互对象可以存在较大差异。比如，不同推荐场景中的人群和商品类型可以存在较大差异。目前，针对不同的场景，可以单独进行建模，每个场景维护各自的模型。

技术实现思路

[0003]鉴于上述，本说明书实施例提供了基于知识迁移进行模型训练的方法及装置。通过本说明书实施例提供的技术方案，知识迁移在不受模型结构限制的情况下，考虑不同场景之间的关联性，由场景关联性得到的迁移权重在知识迁移时能够提高知识迁移的准确率和效率。
[0004]根据本说明书实施例的一个方面，提供了一种基于知识迁移进行模型训练的方法，包括：获取不同场景的场景数据；根据所述场景数据学习各个场景之间的关联性，以得到各个场景对应的迁移权重，其中，每个场景对应的迁移权重包括有该场景与其他场景之间的关联性特征；以及利用知识蒸馏根据所述各个场景对应的迁移权重在由所述场景数据训练得到的通用模型与所述各个场景对应的子模型之间进行知识迁移，以得到所述各个场景的子模型。
[0005]根据本说明书实施例的另一方面，还提供一种基于知识迁移进行模型训练的方法，包括：在推荐平台中获取不同推荐场景的场景数据，其中，所述场景数据包括场景用户数据和场景特征数据，所述场景数据用于表征场景中的用户与场景之间的交互；根据各个推荐场景的显式特征数据和隐式...

【技术保护点】

【技术特征摘要】
1.一种基于知识迁移进行模型训练的方法，包括：获取不同场景的场景数据；根据所述场景数据学习各个场景之间的关联性，以得到各个场景对应的迁移权重，其中，每个场景对应的迁移权重包括有该场景与其他场景之间的关联性特征；以及利用知识蒸馏根据所述各个场景对应的迁移权重在由所述场景数据训练得到的通用模型与所述各个场景对应的子模型之间进行知识迁移，以得到所述各个场景的子模型。2.如权利要求1所述的方法，还包括：基于所述场景数据确定所述各个场景的显式特征数据以及用于表示所述各个场景之间的关联性的隐式特征数据；根据所述场景数据学习各个场景之间的关联性，以得到各个场景对应的迁移权重包括：根据所述各个场景的所述显式特征数据和所述隐式特征数据对所述各个场景进行向量表征，以得到所述各个场景的场景向量表征；以及根据所述场景向量表征得到所述各个场景对应的迁移权重。3.如权利要求2所述的方法，其中，所述显式特征数据包括：场景标识、场景出现位置的位置标识、以及场景所属行业中的至少一种；所述隐式特征数据根据不同场景所涉及的共同用户确定。4.如权利要求2所述的方法，还包括：根据各个场景向量表征与各个聚类簇之间的所属关系，得到各个场景对应的簇向量表征，其中，每个场景对应的簇向量表征用于表示该场景基于所属聚类簇的向量表征；以及根据所述场景向量表征得到所述各个场景对应的迁移权重包括：根据所述场景向量表征以及所述簇向量表征得到所述各个场景对应的迁移权重。5.如权利要求4所述的方法，其中，根据所述场景向量表征以及所述簇向量表征得到所述各个场景对应的迁移权重包括：利用元网络和/或聚类的方式根据所述场景向量表征以及所述簇向量表征得到所述各个场景对应的迁移权重。6.如权利要求1所述的方法，其中，根据所述场景数据学习各个场景之间的关联性，以得到各个场景对应的迁移权重；以及利用知识蒸馏根据所述各个场景对应的迁移权重在由所述场景数据训练得到的通用模型与所述各个场景对应的子模型之间进行知识迁移，以得到所述各个场景的子模型包括：按照以下循环方式对所述各个场景对应的子模型进行训练，直至满足训练结束条件：针对当前场景，根据所述当前场景的场景数据学习所述当前场景与其他场景之间的关联性，以得到所述当前场景对应的迁移权重；针对所述当前场景对应的子模型，根据该子模型对应的迁移权重以及所述通用模型中的各个中间通用网络层，得到该子模型的各个中间子网络层；根据该子模型中的各个中间子网络层和子输出层所输出的结果、以及所述各个中间通用网络层和通用输出层所输出的结果，计算损失；以及根据所述损失对该子模型进行调整。7.如权利要求6所述的方法，其中，针对所述当前场景对应的子模型，根据该子模型对
应的迁移权重以及所述通用模型中的各个中间通用网络层，得到该子模型的各个中间子网络层包括：针对所述当前场景的子模型中的每个中间子网络层，根据所述各个中间通用网络层以及用于表征该中间子网络层与所述各个中间通用网络层之间的相似度的迁移权重，得到该中间子网络层。8.如权利要求6所述的方法，其中，所述损失包括：由所述子输出层所输出的结果和所述通用输出层所输出的结果得到的第一损失，以及由各个中间通用网络层和所述各个中间子网络层输出...

【专利技术属性】
技术研发人员：郇兆鑫，李昂，张晓露，周俊，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人