视频特征提取方法、装置、终端设备及存储介质制造方法及图纸

技术编号：34201989 阅读：13 留言：0更新日期：2022-07-20 10:54

本申请适用于计算机技术领域，提供了一种视频特征提取方法、装置、终端设备及存储介质，方法包括：对待处理视频进行i次采样，得到帧数互不相同的i个视频片段，i为大于1的整数；将i个视频片段输入视频特征提取模型进行处理，输出待处理视频的视频特征集合。本申请提供的视频特征提取方法精确度高。频特征提取方法精确度高。频特征提取方法精确度高。

Video feature extraction method, device, terminal device and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
视频特征提取方法、装置、终端设备及存储介质

[0001]本申请属于计算机
，尤其涉及一种视频特征提取方法、装置、终端设备及存储介质。

技术介绍

[0002]随着多媒体技术的迅速发展，视频已经成为信息处理领域中一种重要的媒体形式。视频能够记录、保存空间和时间上的各种视觉信息。近些年来，随着短视频的迅速发展，围绕短视频的多种视频语义理解需求也急剧增加。而视频特征提取是各种视频语义理解的基础和前提。
[0003]相关技术中，对于视频特征的提取，主要是通过3D卷积神经网络，对待处理视频时间维度和空间维度的特征进行同时提取，得到所需的视频特征。
[0004]然而，这种视频特征提取的方法提取的视频特征存在精确度差的问题。

技术实现思路

[0005]本申请实施例提供了视频特征提取方法、装置、终端设备及存储介质，可以解决视频特征精确度差的问题。
[0006]第一方面，本申请实施例提供了一种视频特征提取方法，包括：
[0007]对待处理视频进行i次采样，得到帧数互不相同的i个视频片段，i为大于1的整数；
[0008]将i个视频片段输入视频特征提取模型进行处理，输出待处理视频的视频特征集合。
[0009]第二方面，本申请实施例提供了一种视频特征提取装置，包括：
[0010]采样模块，用于对待处理视频进行i次采样，得到帧数互不相同的i个视频片段，i为大于1的整数；
[0011]处理模块，用于将i个视频片段输入视频特征提取模型进行处理，输出待处理视频的视频...

【技术保护点】

【技术特征摘要】
1.一种视频特征提取方法，其特征在于，包括：对待处理视频进行i次采样，得到帧数互不相同的i个视频片段，所述i为大于1的整数；将所述i个视频片段输入视频特征提取模型进行处理，输出所述待处理视频的视频特征集合。2.如权利要求1所述的方法，其特征在于，所述i次采样包括i次降采样；或者，所述i次采样包括1次全采样和i
‑
1次降采样；所述视频特征提取模型包括i个子模型，所述视频特征集合包括所述i个子模型分别输出的视频特征；第一个子模型输出的第一视频特征是通过所述第一个子模型对所述i个视频片段中帧数最大的第一视频片段进行时间域和空间域上的视频特征提取得到的；第二个子模型输出的视频特征是通过所述第二个子模型对所述i个视频片段中帧数次大的第二视频片段进行时间域和空间域上的视频特征提取得到第二视频特征，并对所述第二视频特征和所述第一个子模型输出的视频特征进行特征融合得到的；以此类推。3.如权利要求2所述的方法，其特征在于，所述子模型包括多个级联的残差层，所述残差层包括卷积层和通道注意力机制模型；通过子模型对视频片段进行时间域和空间域上的视频特征提取，得到所述视频片段对应的视频特征，包括：通过第一个残差层中的卷积层对所述视频片段进行卷积，得到具有时间维度的第一中间特征图；根据所述第一中间特征图通过所述第一个残差层中的通道注意力机制模型得到第一通道注意力值；以所述第一通道注意力值作为权重对所述视频片段进行加权处理后输出至第二个残差层；通过所述第二个残差层中的卷积层对所述第一个残差层的输出进行卷积，得到具有时间维度的第二中间特征图；根据所述第二中间特征图通过所述第二个残差层中的通道注意力机制模型得到第二通道注意力值；以所述第二通道注意力值作为权重对所述第一个残差层的输出进行加权处理后输出至第三个残差层；以此类推；根据最后一个残差层的输出确定所述视频片段对应的视频特征。4...

【专利技术属性】
技术研发人员：杨捷文，
申请(专利权)人：TCL科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人