基于自学习策略的跨模态知识蒸馏方法、装置及存储介质制造方法及图纸

技术编号：36208409 阅读：62 留言：0更新日期：2023-01-04 12:04

本发明专利技术公开了一种基于自学习策略的跨模态知识蒸馏方法、装置及存储介质，包括以下步骤，从源数据中提取模态数据，所述模态数据包括视频数据和声音数据，使用卷积神经网络提取模态数据中的图片特征信息和声音特征信息；根据所述图片特征信息和声音特征信息训练教师模型和学生模型；从教师模型输出软目标，使用卷积神经网络从软目标中学习学生模型；采用软目标引导学生模型进行优化。利用神经网络自学习优化策略，通过将不同模态数据的特征嵌入到单模态数据的学生网络中，一方面，能提高模型在预测时的性能，另一方面，能在低资源设备上高效运行深度学习模型。高效运行深度学习模型。高效运行深度学习模型。

全部详细技术资料下载

【技术实现步骤摘要】
基于自学习策略的跨模态知识蒸馏方法、装置及存储介质

[0001]本专利技术属于知识蒸馏方法的
，具体涉及基于自学习策略的跨模态知识蒸馏方法、装置及存储介质。

技术介绍

[0002]知识蒸馏是一种在烦琐的模型中提炼知识并将其压缩为单个模型的方法，以便可以将其部署到实际应用中。指将笨拙的模型(教师模型)的学习行为转移到较小的模型(学生模型)。
[0003]跨模态知识蒸馏方法，是一种新型的教师
‑
学生训练结构，通常是已训练好的笨拙的模型，即教师模型提供知识，学生模型通过蒸馏训练来获取教师的知识，它可以将复杂教师模型的知识迁移到学生模型中。
[0004]传统模型部署主要有以下几个缺点：模型太大导致无法在低资源设备上运行；模型在设备端实时性不高；在设备上部署后，消耗过大的能耗问题。

技术实现思路

[0005]本专利技术的目的是提供一种基于自学习策略的跨模态知识蒸馏方法、装置及存储介质，解决传统模型部署具有模型太大导致无法在低资源设备上运行；模型在设备端实时性不高；在设备上部署后，消耗过大的能耗的问题。
[0006]为了实现上述目的，本专利技术采用以下技术方案：
[0007]本专利技术第一方面提供基于自学习策略的跨模态知识蒸馏方法，包括以下步骤：
[0008]S1、从源数据中提取模态数据，所述模态数据包括视频数据和声音数据，使用卷积神经网络提取模态数据中的图片特征信息和声音特征信息；
[0009]S2、根据所述图片特征信息和声音特征信息训练教...

【技术保护点】

【技术特征摘要】
1.基于自学习策略的跨模态知识蒸馏方法，其特征在于，包括以下步骤：S1、从源数据中提取模态数据，所述模态数据包括视频数据和声音数据；S2、使用卷积神经网络提取模态数据中的图片特征信息和声音特征信息；S3、根据所述图片特征信息和声音特征信息训练教师模型和学生模型；S4、从所述教师模型输出软目标，从软目标中对所述学生模型进行学习；S5、采用软目标引导学生模型进行优化。2.根据权利要求1所述的基于自学习策略的跨模态知识蒸馏方法，其特征在于，获取相关的未经过训练的图片或视频作为测试数据，使用测试数据对所述教师模型与学生模型进行测试，获取学生模型和教师模型的性能结果。3.根据权利要求1所述的基于自学习策略的跨模态知识蒸馏方法，其特征在于，采用软目标引导学生模型进行优化的方法包括以下步骤：S401、根据教师网络和学生网络通过前向传播方式得到各自的教师网络软目标与学生网络软目标；S402、根据教师网络软目标与学生网络软目标进行计算蒸馏损失；S403、通过所述蒸馏损失，再利用反向传播方式中的随机梯度下降方式进行更新参数和权重，从而优化模型。4.基于自学习策略的跨模态知识蒸馏装置，其特征在于，包括：模态数据提取模块，用于从源数据中提取模态数据，所述模态数据包括视频数据和声音数据；特征信息提取模块，用于使用卷积神经网络提取模态数据中的图片特征信息和声音特征信息；模型训练模块，用于根据所述图片特征信息和声音特征信息...

【专利技术属性】
技术研发人员：王东荣，刘朝勇，邓靖，
申请(专利权)人：珠海鸿晟新科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人