视频分类的方法、构建分类模型的方法、装置和设备制造方法及图纸

技术编号：34473801 阅读：19 留言：0更新日期：2022-08-10 08:48

本申请公开了一种视频分类的方法、构建分类模型的方法、装置和设备，可以应用于视频分类领域。该视频分类方法包括：获取待分类视频，将待分类视频输入分类模型进行视频分类；其中，分类模型是由已分类视频对初始化模型训练得到的，初始化模型是由基于未分类视频训练的自监督模型的模型参数得到的。本申请在获得分类模型的过程中，利用未分类视频训练得到应用于分类模型的模型参数，避免了原有的需要大量已分类视频对分类模型进行训练的情况，减少了人工分类的时间，提高了分类模型的训练效率和精度，进而提升视频分类的效率和精度。进而提升视频分类的效率和精度。进而提升视频分类的效率和精度。

全部详细技术资料下载

【技术实现步骤摘要】
视频分类的方法、构建分类模型的方法、装置和设备

[0001]本申请涉及视频分类
，尤其涉及一种视频分类的方法、构建分类模型的方法、装置和设备。

技术介绍

[0002]目前，在视频类应用软件的使用场景中，普遍存在对视频进行分类的需求。通常，对视频进行分类可以采用人工审核标注的方法，由工作人员查看视频并进行类别标注，这一过程存在视频分类效率较低和视频分类精度较低的问题。
[0003]随着视频数量的不断增大，使用现有分类方法已经难以满足业务需求，提高视频分类的效率和精度，已经成为解决视频分类问题的发展方向。

技术实现思路

[0004]本申请提供了一种视频分类的方法、构建分类模型的方法、装置和设备，以实现不同视频的分类，提升视频分类的效率和精度。
[0005]第一方面，本申请提供一种视频分类的方法，包括：获取待分类视频，其中，待分类视频为未标注视频类别的视频；将待分类视频输入分类模型进行视频分类；其中，分类模型是由已分类视频对初始化模型训练得到的，初始化模型是由基于未分类视频训练的自监督模型的模

【技术保护点】

【技术特征摘要】
1.一种视频分类的方法，其特征在于，所述方法包括：获取待分类视频，其中，所述待分类视频为未标注视频类别的视频；将所述待分类视频输入分类模型进行视频分类；其中，所述分类模型是由已分类视频对初始化模型训练得到的，所述初始化模型是由基于未分类视频训练的自监督模型的模型参数得到的。2.根据权利要求1所述的分类方法，其特征在于，在所述将所述待分类视频输入分类模型进行视频分类之前，所述方法还包括：获得已分类视频；使用所述已分类视频训练所述初始化模型得到所述分类模型。3.根据权利要求2所述的分类方法，其特征在于，在所述使用所述已分类视频训练所述初始化模型得到所述分类模型之前，所述方法还包括：获得未分类视频；通过所述未分类视频对自监督模型进行训练；根据训练后的自监督模型的模型参数，对初始模型进行初始化，以得到所述初始化模型。4.根据权利要求3所述的分类方法，其特征在于，所述通过所述未分类视频对自监督模型进行训练，包括：使未训练的自监督模型，提取所述未分类视频的图像特征和文本特征；计算所述图像特征与所述文本特征的相似度；根据所述相似度，训练所述自监督模型。5.根据权利要求3所述的分类方法，其特征在于，所述通过所述未分类视频对自监督模型进行训练，还包括：将所述未分类视频中第一视频的图像数据以及所述第一视频的文本数据作为正样本；将所述未分类视频中所述第一视频的图像数据以及第二视频的文本数据作为负样本；使未训练的自监督模型，提取所述正样本的图像特征和文本特征以及所述负样本的图像特征和文本特征；计算所述正样本的所述图像特征与所述文本特征的第一相似度，以及计算所述负样本的所述图像特征与所述文本特征的第二相似度；基于所述第一相似度和所述第二相似度，训练所述自监督模型。6.根据权利要求5所述的分类方法，其特征在于，所述基于所述第一相似度和所述第二相似度，训练所述自监督模型，包括：当所述第一相似度和/或所述第二相似度满足预设约束条件时，确定所述自监督模型完成训练；其中，所述预设约束条件包括以下至少一个：所述第一相似度的取值为第一值、所述第二相似度的取值为第二值、所述第一相似度的取值与所述第二相似度的取值之差大于第三值。7.一种构建分类模型的方法，其特征在于，所述方法包括：获得未分类视频；通过所述未分类视频对自监督模型进行训练；
根据训练后的自监督模型的模型参数，对初始模型进行初始化，以得到初始化模型；获取已分类视频；使用所述已分类视频训练所述初始化模型得到所述分类模型。8.根据权利要求7所述的方法，其特征在于，所述通过所述未分类视频对自监督模型进行训练，包括：使未训练的自监督模型，提取所述未分类视频的图像特征和文本特征；计算所述图像特征与所述文本特征的相似度；根据所述相似度，训练所述自监督模型。9.根据权利要求7所述的方法，其特征在于，所述通过所述未分类视频对自监督模型进行训练，包括：将所述未分类视频中第一视频的图像数据以及所述第一视频的文本数据作为正样本；将所述未分类视频中所述第一视频的图像数据以及第二视频的文本数据作为负样本；使未训练的自监督模型，提取所述正样本的图像特征和文本特征以及所述负样本的图像特征和文本特征；计算所述正样本的所述图像特征与所述文本特征的第一相似度，以及计算所述负样本的所述图像特征与所述文本特征的第二相似度；基于所述第一相似度和所述第二相似度，训练所述自监督模型。10.根据权利要求9所述的方法，其特征在于，所述基于所述第一相似度和所述第二相似度，训练所述自监督模型，包括：当所述第一相似度和/或所述第二相似度满足预设约束条件时，确定所述自监督模型完成训练；其中，所述预设约束条件包括以下至少一个：所述第一相似度的取值为第一值、所述第二相似度的取值为第二值、所述第一相似度的取值与所述第二相似度的取值之差大于第三值。11.一种视频分类的装置，其特征在于，包括：获取模块，用于获取待分类视频，其中，所述待分类视频为未标注视频类别的视...

【专利技术属性】
技术研发人员：阚野，
申请(专利权)人：北京快乐茄信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人