视频处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：36649616 阅读：19 留言：0更新日期：2023-02-18 13:11

本申请涉及一种视频处理方法、装置、计算机设备和存储介质。所述方法包括：通过待训练的识别模型，分别提取源域和目标域下的视频样本的深度特征；通过域适应训练器对深度特征进行多时间尺度特征提取，分别得到源域和目标域下的多时间尺度的视频特征；按照视频特征对应的时间节点和时间尺度权重，将源域和目标域下的视频特征分组对齐；时间尺度权重与相应视频特征所表达的信息量正相关；根据同组内的源域和目标域下的视频特征之间的对抗损失，以及源域下的视频样本的预测类别与相应样本标签之间的类别损失，调整识别模型的模型参数并继续进行对抗训练，直至满足训练停止条件时结束训练。采用本方法能够有效提高视频识别的准确率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
视频处理方法、装置、计算机设备和存储介质

[0001]本申请涉及计算机视觉
，特别是涉及一种视频处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着图像处理技术和人工智能技术的迅速发展，出现了视频识别技术，例如对视频内容中对象的行为等进行检测识别，以实现自动识别视频的类别。
[0003]相关技术中，通常是利用大量标注的样本数据训练网络模型，以通过训练得到的网络模型对标注领域的视频中各静态帧进行分类识别。然而，这种方式仅能适用于对标注领域的视频的分类识别，对于其他领域下的视频，就无法准确识别，导致对其他领域下的视频识别的准确性较低。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够有效提高视频识别的准确率的视频处理方法、装置、计算机设备和存储介质。
[0005]一种视频处理方法，所述方法包括：
[0006]通过待训练的识别模型，分别提取源域和目标域下的视频样本的深度特征；所述源域下的视频样本携带样本标签；
[0007]通过域适应训练器对所述深度特征进行多时间尺度特征提取，分别得到源域和目标域下的多时间尺度的视频特征；
[0008]按照所述视频特征对应的时间节点和时间尺度权重，将源域和目标域下的视频特征分组对齐；所述时间尺度权重与相应视频特征所表达的信息量正相关；
[0009]根据同组内的源域和目标域下的视频特征之间的差异，确定对抗损失；
[0010]基于源域下的视频样本的预测类别与相应样本标签之间的差异，确...

【技术保护点】

【技术特征摘要】
1.一种视频处理方法，其特征在于，所述方法包括：通过待训练的识别模型，分别提取源域和目标域下的视频样本的深度特征；所述源域下的视频样本携带样本标签；通过域适应训练器对所述深度特征进行多时间尺度特征提取，分别得到源域和目标域下的多时间尺度的视频特征；按照所述视频特征对应的时间节点和时间尺度权重，将源域和目标域下的视频特征分组对齐；所述时间尺度权重与相应视频特征所表达的信息量正相关；根据同组内的源域和目标域下的视频特征之间的差异，确定对抗损失；基于源域下的视频样本的预测类别与相应样本标签之间的差异，确定类别损失；所述预测类别，是基于所述源域下的视频样本的视频特征进行分类得到；根据所述对抗损失和所述类别损失，调整所述识别模型的模型参数并继续进行对抗训练，直至满足训练停止条件时结束训练。2.根据权利要求1所述的方法，其特征在于，所述通过域适应训练器对所述深度特征进行多时间尺度特征提取，分别得到源域和目标域下的多时间尺度的视频特征，包括：通过域适应训练器分别对所述深度特征进行多时间尺度卷积处理，得到所述深度特征对应的卷积结果；根据所述深度特征所对应的时间节点权重和相应的卷积结果，分别得到所述源域和所述目标域下的多时间尺度的视频特征。3.根据权利要求2所述的方法，其特征在于，所述域适应训练器是通过卷积层进行多时间尺度卷积处理；所述域适应训练器还包括时间节点注意力层；所述方法还包括：通过所述时间节点注意力层，根据各时间节点下的深度特征所表达的信息量，分别对所述深度特征所对应的时间节点分配对应的时间节点权重；所述时间节点权重与相应时间节点下的深度特征所表达的信息量正相关。4.根据权利要求1所述的方法，其特征在于，在所述按照所述视频特征对应的时间节点和时间尺度权重，将源域和目标域下的视频特征分组对齐之前，所述方法还包括：通过所述域适应训练器的时间尺度注意力层，确定源域和目标域下各时间尺度的视频特征对应的信息熵；所述信息熵表征相应视频特征所表达的信息量；根据所述信息熵，分别对各时间尺度的视频特征分配相应的时间尺度权重。5.根据权利要求1所述的方法，其特征在于，所述按照所述视频特征对应的时间节点和时间尺度权重，将源域和目标域下的视频特征分组对齐，包括：通过所述域适应训练器，根据各所述视频特征对应的时间节点和时间尺度权重，确定源域和目标域下待对齐的视频特征；将待对齐的视频特征划分为一组，得到多组对齐后的视频特征；每一组内的视频特征包括相同时间尺度的源域和目标域下的视频特征。6.根据权利要求5所述的方法，其特征在于，所述通过所述域适应训练器，根据各所述视频特征对应的时间节点和时间尺度权重，确定源域和目标域下待对齐的视频特征，包括：确定源域和目标域下的视频特征在相应时间节点下的时间节点权重；从源域和目标域下的视频特征中，确定不同域下时间节点权重和时间尺度权重相匹配
的视频特征，作为源域和目标域下待对齐的视频特征。7.根据权利要求1所述的方法，其特征在于，所述通过待训练的识别模型，分别提取源域和目标域下的视频样本的深度特征，包括：通过待训练的识别模型中的初始特征提取器，分别提取源域和目标域下的视频样本的初始特征；通过所述识别模型中的目标特征提取器，分别对源域和目标域下的视频样本的初始特征进行特提取，得到源域和目标域下的视频样本的深度特征。8.根据权利要求7所述的方法，其特征在于，所述方法还包括：通过所述识别模型的分类器，基于所...

【专利技术属性】
技术研发人员：马锦华，高远，陈培鹏，
申请(专利权)人：中山大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人