视频特征学习方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：18204783 阅读：39 留言：0更新日期：2018-06-13 06:33

本发明专利技术实施例提供一种视频特征学习方法、装置、电子设备及可读存储介质。该方法包括：获得待训练的视频样本；按照预设帧数对所述视频样本进行等间隔采样，由采样的视频帧组成视频分段；针对各视频分段，提取各视频分段的视觉特征，并计算各视觉特征对应的运动基元数量；基于各视频分段的运动基元数量和预设约束条件对目标分类模型进行训练，得到训练后的目标分类模型，以实现对视频特征的学习。由此，相较于现有技术而言，本发明专利技术提供的技术方案无需获知视频的标签和分类信息就可以实现视频特征的无监督学习，降低资源和成本消耗，并且可以适应于广泛的视频场景。

全部详细技术资料下载

【技术实现步骤摘要】
视频特征学习方法、装置、电子设备及可读存储介质
本专利技术涉及计算机
，具体而言，涉及一种视频特征学习方法、装置、电子设备及可读存储介质。
技术介绍
视频特征学习具有广泛的应用领域，例如可包括视频分类、相似视频检索、视频匹配等。目前的视频特征学习方法主要是基于视频标签和分类信息，而上述视频标签和分类信息需要人工标注作业，在数据量巨大的实际业务应用场景，非常消耗资源和成本。
技术实现思路
为了克服现有技术中的上述不足，本专利技术的目的在于提供一种视频特征学习方法、装置、电子设备及可读存储介质，无需获知视频的标签和分类信息就可以实现视频特征的无监督学习，降低资源和成本消耗，并且可以适应于广泛的视频场景。为了实现上述目的，本专利技术较佳实施例采用的技术方案如下：本专利技术较佳实施例提供一种视频特征学习方法，应用于电子设备，所述方法包括：获得待训练的视频样本；按照预设帧数对所述视频样本进行等间隔采样，由采样的视频帧组成视频分段；针对各视频分段，提取各视频分段的视觉特征，并计算各视觉特征对应的运动基元数量；基于各视频分段的运动基元数量和预设约束条件对目标分类模型进行训练，得到训练后的目标分类模型，以实现对视频特征的学习。在本专利技术较佳实施例中，所述提取各视频分段的视觉特征的方式，包括：通过预先配置的特征提取模型或者深度学习模型将各视频分段中的各帧图像信息进行融合后提取各视频分段的视觉特征。在本专利技术较佳实施例中，所述计算各视觉特征对应的运动基元数量的方式，包括：将所述视觉特征输入到预先配置的运动基元计算模型，得到所述视觉特征对应的运动基元数量。在本专利技术较佳...
视频特征学习方法、装置、电子设备及可读存储介质

【技术保护点】
一种视频特征学习方法，其特征在于，应用于电子设备，所述方法包括：获得待训练的视频样本；按照预设帧数对所述视频样本进行等间隔采样，由采样的视频帧组成视频分段；针对各视频分段，提取各视频分段的视觉特征，并计算各视觉特征对应的运动基元数量；基于各视频分段的运动基元数量和预设约束条件对目标分类模型进行训练，得到训练后的目标分类模型，以实现对视频特征的学习。

【技术特征摘要】
1.一种视频特征学习方法，其特征在于，应用于电子设备，所述方法包括：获得待训练的视频样本；按照预设帧数对所述视频样本进行等间隔采样，由采样的视频帧组成视频分段；针对各视频分段，提取各视频分段的视觉特征，并计算各视觉特征对应的运动基元数量；基于各视频分段的运动基元数量和预设约束条件对目标分类模型进行训练，得到训练后的目标分类模型，以实现对视频特征的学习。2.根据权利要求1所述的视频特征学习方法，其特征在于，所述提取各视频分段的视觉特征的方式，包括：通过预先配置的特征提取模型或者深度学习模型将各视频分段中的各帧图像信息进行融合后提取各视频分段的视觉特征。3.根据权利要求1所述的视频特征学习方法，其特征在于，所述计算各视觉特征对应的运动基元数量的方式，包括：将所述视觉特征输入到预先配置的运动基元计算模型，得到所述视觉特征对应的运动基元数量。4.根据权利要求1所述的视频特征学习方法，其特征在于，所述基于各视频分段的运动基元数量和预设约束条件对目标分类模型进行训练，得到训练后的目标分类模型，包括：基于各视频分段的运动基元数量对目标分类模型进行训练；在训练过程中根据预设损失函数计算该目标分类模型的Loss值，直到所述Loss值小于预设值时结束训练，得到训练后的目标分类模型，其中，当所述述Loss值小于预设值时，所述训练后的目标分类模型满足所述预设约束条件。5.根据权利要求4所述的视频特征学习方法，其特征在于，所述预设损失函数为：Loss＝(N(F(X1))-N(F(X2))2)+max(0,C-(N(F(Y))-N(F(X1)))2)其中，X1和X2是同一个视频样本X中按照预设帧数间隔得到两个视频分段，Y为不同于视频样本X的另一个视频样本，函数F为对视频片段的特征表示方法，函数N为根据视频特征提取运动基元数量的方法，C为用于保证最优解非零的一个常数。6.根据权利要求1-5中任意一项所述的视频特征学习方法，其特征在于，所述预设约束条件包括：同一视频样本中的各个视频分段对应的运动基元数量之间的差异小于预设阈值；以及不同视频样本中的各个视频分段对应的运动基元数量之间的差异大于同一视频样本中的各个视频分段...

【专利技术属性】
技术研发人员：丁大钧，赵丽丽，刘旭，
申请(专利权)人：厦门美图之家科技有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人