【技术实现步骤摘要】
一种视频分类模型的训练方法及相关装置
[0001]本申请涉及人工智能
,尤其涉及一种视频分类模型的训练方法及相关装置。
技术介绍
[0002]人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0003]随着社交媒体的快速发展,社交媒体平台上每天都会产生大量新的视频,这对视频分类方法提出了迫切的需求。目前,相关技术中的视频分类方法是采用训练好的视频分类模型对视频进行分类。在基于旧的视频数据训练得到视频分类模型之后,如果新的视频数据与旧的视频数据差异较大,则视频分类模型难以很好地对新的视频数据进行分类。
[0004]基于此,一种相关技术是基于新的视频数 ...
【技术保护点】
【技术特征摘要】
1.一种视频分类模型的训练方法,其特征在于,包括:获取待训练数据;获取第一模型和第二模型;将所述待训练数据分别输入所述第一模型和所述第二模型,以获取所述第一模型提取的第一时序特征和第一空间特征以及所述第二模型提取的第二时序特征和第二空间特征;以所述第一模型为教师网络,根据第一损失函数和第二损失函数,对所述第二模型进行知识蒸馏,以更新所述第二模型,其中,所述第一损失函数是基于所述第一时序特征和所述第二时序特征得到的,所述第二损失函数是基于所述第一空间特征和所述第二空间特征得到的。2.根据权利要求1所述的方法,其特征在于,所述待训练数据包括第一数据集和第二数据集,所述第一模型为基于所述第一数据集训练的视频分类模型。3.根据权利要求2所述的方法,其特征在于,所述获取待训练数据包括:获取所述第一数据集中的第一视频数据;确定所述第一视频数据中的多个关键帧,以得到第二视频数据,所述多个关键帧用于表征所述第一视频数据中的对象的运动信息;基于所述第二视频数据和所述第二数据集,得到所述待训练数据。4.根据权利要求3所述的方法,其特征在于,所述多个关键帧中任意两个相邻的关键帧之间的差异值大于或等于预设阈值。5.根据权利要求1至4任意一项所述的方法,其特征在于,所述第一时序特征是由第一特征和第二特征串接得到的,所述第一特征是所述第一模型对所述待训练数据的宽度维度特征进行操作得到的,所述第二特征是所述第一模型对所述待训练数据的高度维度特征进行操作得到的;或者,所述第二时序特征是由第三特征和第四特征串接得到的,所述第三特征是所述第二模型对所述待训练数据的宽度维度特征进行操作得到的,所述第四特征是所述第二模型对所述待训练数据的高度维度特征进行操作得到的。6.根据权利要求1至5任意一项所述的方法,其特征在于,所述第一空间特征是所述第一模型对第五特征的时间维度特征进行操作后得到的,所述第五特征是所述第一模型基于轨迹信息对齐所述待训练数据中每个图像帧的特征后得到的;或者,所述第二空间特征是所述第二模型对第六特征的时间维度特征进行操作后得到的,所述第六特征是所述第二模型基于轨迹信息对齐所述待训练数据中每个图像帧的特征后得到的。7.一种视频分类方法,其特征在于,包括:获取待分类视频;将所述待分类视频输入第二模型,得到分类结果;其中,所述第二模型是以第一模型为教师网络,根据第一损失函数和第二损失函数进行知识蒸馏得到的,所述第一损失函数是基于第一时序特征和第二时序特征得到的,所述第二损失函数是基于第一空间特征和第二空间特征得到的,所述第一时序特征和所述第一
空间特征是将待训练数据输入第一模型后得到的,所述第二时序特征和所述第二空间特征是将所述待训练数据输入所述第二模型后得到的。8.根据权利要求7所述的方法,其特征在于,所述待训练数据包括第一数据集和第二数据集,所述第一模型为基于所述第一数据集训练的视频分类模型。9.根据权利要求7或8所述的方法,其特征在于,所述待训练数据是基于第二视频数据和所述第二数据集得到的,所述第二视频数据包括多个关键帧,所述多个关键帧是基于第一视频数据得到的,所述多个关键帧用于表征所述第一视频数据中的对象的运动信息,所述第一视频数据属于所述第一数据集。10.根据权利要求9所述的方法,其特征在于,所述多个关键帧中任意两个相邻的关键帧之间的差异值大于或等于预设阈值。11.根据权利要求7至10任意一项所述的方法,其特征在于,所述第一时序特征是由第一特征和第二特征串接得到的,所述第一特征是所述第一模型对所述待训练数据的宽度维度特征进行操作得到的,所述第二特征是所述第一模型对所述待训练数据的高度维度特征进行操作得到的;或者,所述第二时序特征是由第三特征和第四特征串接得到的,所述第三特征是所述第二模型对所述待训练数据的宽度维度特征进行操作得到的,所述第四特征是所述第二模型对所述待训练数据的高度维度特征进行操作得到的。12.根据权利要求7至11任意一项所述的方法,其特征在于,所述第一空间特征是所述第一模型对第五特征的时间维度特征执行进行后得到的,所述第五特征是所述第一模型基于轨迹信息对齐所述待训练数据中每个图像帧的特征后得到的;或者,所述第二空间特征是所述第二模型对第六特征的时间维度特征进行操作后得到的,所述第六特征是所述第二模型基于轨迹信息对齐所述待训练数据中每个图像帧的特征后得到的。13.一种训练装置,其特征在于,包括:获取单元和处理单元;所述获取单元,用于获取待训练数据;所述获取单元,还用于获取第一模型和第二模型;所述处理单元,用于将所述待训练数据分别输入所述第一模型和所述第二模型,以获取所述第一模型提取的第一时序特征和第一空间特征以及所述第二模型提取的第二时序特征和第二空间特征;所述处理单元,还用于以所述第一模型为教师网络,根据第一损失函数和第二损失函数,对所述第二模型进行知识蒸馏,以更新所述第二模型,其中,所述第一损...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。