视频属性确定方法、装置、设备及存储介质制造方法及图纸

技术编号：35096704 阅读：13 留言：0更新日期：2022-10-01 17:00

本申请公开了一种视频属性确定方法、装置、设备及存储介质，可以应用于云技术、人工智能、智慧交通、车联网等各种场景，所述方法包括：获取目标视频的目标视频帧；对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征；对所述目标视频帧进行场景特征提取，得到所述目标视频的目标场景特征；对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征；根据所述目标融合特征，确定所述目标视频的目标属性信息。本申请提高了确定的属性信息的准确率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
视频属性确定方法、装置、设备及存储介质

[0001]本申请涉及互联网
，尤其涉及一种视频属性确定方法、装置、设备及存储介质。

技术介绍

[0002]相关技术中，直接使用在公开数据集上预训练好的图像模型提取特征，能够提取出较适合业务数据的粗粒度分类任务相关的视觉特征。但是缺少对多模态信息的综合建模利用，通常单依靠视觉信息来识别，缺失有辨识力的特征提取器，难区分细粒度的业务数据标签；且缺失对场景上下文的信息提取；因此，难以保证准确率和召回率。

技术实现思路

[0003]本申请提供了一种视频属性确定方法、装置、设备及存储介质，可以提高确定的属性信息的准确率。
[0004]一方面，本申请提供了一种视频属性确定方法，所述方法包括：
[0005]获取目标视频的目标视频帧；
[0006]对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征；
[0007]对所述目标视频帧进行场景特征提取，得到所述目标视频的目标场景特征；
[0008]对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征；
[0009]根据所述目标融合特征，确定所述目标视频的目标属性信息。
[0010]另一方面提供了一种视频属性确定装置，所述装置包括：
[0011]目标视频帧获取模块，用于获取目标视频的目标视频帧；
[0012]目标图像属性特征确定模块，用于对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性...

【技术保护点】

【技术特征摘要】
1.一种视频属性确定方法，其特征在于，所述方法包括：获取目标视频的目标视频帧；对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征；对所述目标视频帧进行场景特征提取，得到所述目标视频的目标场景特征；对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征；根据所述目标融合特征，确定所述目标视频的目标属性信息。2.根据权利要求1所述的方法，其特征在于，所述对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征，包括：确定所述目标视频中至少两个目标对象各自的结构完整度和清晰度；将结构完整度大于第一阈值且清晰度大于第二阈值的对象，确定为第一目标对象，将所述至少两个目标对象中除所述第一目标对象之外的对象确定为第二目标对象；对所述第一目标对象进行对象特征提取，得到第一目标图像属性特征；对所述第二目标对象进行对象特征提取，得到第二目标图像属性特征；将所述第一目标图像属性特征以及所述第二目标图像属性特征作为所述目标图像属性特征。3.根据权利要求2所述的方法，其特征在于，所述对所述第二目标对象进行对象特征提取，得到第二目标图像属性特征，包括：对所述第二目标对象进行自重构特征提取，得到目标自重构特征；对所述第二目标对象进行属性描述特征提取，得到目标描述特征；将所述目标自重构特征以及所述目标描述特征，作为所述第二目标图像属性特征。4.根据权利要求3所述的方法，其特征在于，所述对所述第二目标对象进行自重构特征提取，得到目标自重构特征，包括：基于自重构特征提取模型，对所述第二目标对象进行自重构特征提取，得到所述目标自重构特征。5.根据权利要求4所述的方法，其特征在于，所述自重构特征提取模型的训练方法包括：将样本视频帧划分成至少两个网格图像；对至少一个网格图像进行图像处理，得到处理后视频帧；所述图像处理包括网格图像的位置更换、网格图像中部分图像的遮挡处理中的至少一种；基于所述处理后视频帧，对第一预设模型进行自重构特征提取训练，得到自重构特征；基于所述自重构特征，对第二预设模型进行图像重构训练，得到重构视频帧；在训练过程中，不断调整第一预设模型的第一模型参数以及第二预设模型的第二模型参数，直至所述第二预设模型输出的重构视频帧与所述样本视频帧相匹配；将当前第一模型参数所对应的第一预设模型，作为所述自重构特征提取模型；所述当前第一模型参数为所述第一预设模型，在所述第二预设模型输出的重构视频帧与所述样本视频帧相匹配时的模型参数。6.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述目标视频对应的目标音频以及目标文本；
对所述目标音频进行对象特征提取，得到所述目标对象的目标音频属性特征；对所述目标文本进行对象特征提取，得到所述目标对象的目标文本属性特征。7.根据权利要求6所述的方法，其特征在于，所述对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征，包括：对所述目标图像属性特征、所述目标场景...

【专利技术属性】
技术研发人员：胡益珲，岑杰鹏，杨伟东，祁雷，马锴，陈宇，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人