无监督的训练数据生成方法、装置、介质及设备制造方法及图纸

技术编号：35459025 阅读：21 留言：0更新日期：2022-11-03 12:22

本申请公开了无监督的训练数据生成方法、装置、介质及设备，涉及人工智能技术领域，该方法包括：获取第一原始视频和第二原始视频；确定所述第一原始视频中的目标视频片段，任一目标视频片段中视频帧对应的场景相关性满足预设条件；将所述目标视频片段和所述第二原始视频进行合成，得到目标合成视频；确定所述目标视频片段在所述目标合成视频中的时序位置信息；基于所述目标合成视频和所述时序位置信息，生成时序定位模型的训练数据。本申请采用无监督的方式生成训练数据，节省了人工标注成本，同时突出训练数据中的时序标注信息而省去行为类别标注信息，能够提升所训练的时序定位模型在时序边界上的预测准确性和在场景上的自适应性。自适应性。自适应性。

全部详细技术资料下载

【技术实现步骤摘要】
无监督的训练数据生成方法、装置、介质及设备

[0001]本申请涉及人工智能
，具体涉及无监督的训练数据生成方法、装置、介质及设备。

技术介绍

[0002]人工智能(Artificial Intelligence，AI)是计算机科学的一个综合技术，通过研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，例如自然语言处理、机器学习、深度学习等几大方向。随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。
[0003]相关技术中，利用人工智能技术中的深度学习进行时序行为的定位预测。在以深度学习网络为基础构建时序行为定位模型时，因将时序行为的定位任务划分为时序边界上行为的识别与分类，故时序行为定位模型所采用的训练数据需要包含行为类别的标注信息，导致人工标注成本过高且时序行为定位模型对于时序边界的预测不够准确，此外时序行为定位模型的应用范围与所标注过的行为类别相关，这限制了时序行为定位模型的迁移。

技术实现思路

[0004]为了解决上述技术问题，本申请提供了无监督的训练数据生成方法、装置、介质及设备。所述技术方案如下：
[0005]第一方面，本申请提供了一种无监督的训练数据生成方法，所述方法包括：
[0006]获取第一原始视频和第二原始视频；
[0007]确定所述第一原始视频中的至少一个目标视频片段，任一目标视频片段中视频帧对应的场景相关性满足预设条件；
[0008]将所述至少一个...

【技术保护点】

【技术特征摘要】
1.一种无监督的训练数据生成方法，其特征在于，所述方法包括：获取第一原始视频和第二原始视频；确定所述第一原始视频中的至少一个目标视频片段，任一目标视频片段中视频帧对应的场景相关性满足预设条件；将所述至少一个目标视频片段和所述第二原始视频进行合成，得到目标合成视频；确定所述至少一个目标视频片段在所述目标合成视频中的时序位置信息；基于所述目标合成视频和所述时序位置信息，生成时序定位模型的训练数据。2.根据权利要求1所述的方法，其特征在于，所述确定所述第一原始视频中的至少一个目标视频片段，包括：确定所述第一原始视频中的基准帧；依次将所述基准帧之后的视频帧作为当前帧；确定所述基准帧和所述当前帧的场景相关性；在所述场景相关性满足所述预设条件的情况下，将所述当前帧作为所述基准帧的连续相似帧；根据所述基准帧和所述基准帧的至少一个连续相似帧，得到以所述基准帧为起始帧的当前视频片段，所述当前视频片段为所述至少一个目标视频片段中的任一目标视频片段。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：在所述场景相关性不满足所述预设条件的情况下，将所述当前帧作为所述基准帧。4.根据权利要求2所述的方法，其特征在于，所述方法还包括：获取预设帧数，依次将所述基准帧之后且与所述基准帧间隔所述预设帧数的视频帧作为所述当前帧；确定所述基准帧和所述当前帧的场景相关性；在所述场景相关性满足所述预设条件的情况下，将在所述基准帧和所述当前帧之间的视频帧以及所述当前帧作为所述基准帧的连续相似帧。5.根据权利要求1所述的方法，其特征在于，所述将所述至少一个目标视频片段和所述第二原始视频进行合成，得到目标合成视频，包括：确定所述至少一个目标视频片段在所述第二原始视频中的插入位置信息；按照所述插入位置信息，将所述至少一个目标视频片段插入至所述第二原始视频中，得到所述目标合成视频。6.根据权利要...

【专利技术属性】
技术研发人员：张粲，杨田雨，翁俊武，曹蒙，王珏，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人