一种样本数据生成方法、装置、设备及存储介质制造方法及图纸

技术编号：36966556 阅读：23 留言：0更新日期：2023-03-22 19:27

本公开提供了一种样本数据生成方法、装置、设备及存储介质，涉及计算机技术领域，尤其涉及视频处理、图像处理、深度学习等人工智能技术领域。具体实现方案为：利用镜头切分模型将样本视频切分为多个镜头片段，得到多个镜头边界伪标签，镜头边界伪标签用于指示样本视频中包括的镜头边界视频帧；删除以镜头边界伪标签对应的切分点为中心的第一预设数量的连续视频帧；将每个镜头片段中的最后一个视频帧作为真实镜头边界标签；将当前的样本视频和真实镜头边界标签作为用于训练目标镜头切分模型的样本数据。可以自动生成样本数据，无需人工标注。标注。标注。

全部详细技术资料下载

【技术实现步骤摘要】
一种样本数据生成方法、装置、设备及存储介质

[0001]本公开涉及计算机
，尤其涉及视频处理、图像处理、深度学习等人工智能

技术介绍

[0002]一个完整的视频通常是由多个镜头片段组合而成的，识别出视频中包括的镜头片段后，可以基于识别结果进行很多下游任务，比如抽取高光镜头、识别视频场景以及进行视频图像去重等。

技术实现思路

[0003]本公开提供了一种样本数据生成方法、装置、设备以及存储介质。
[0004]根据本公开的第一方面，提供了一种样本数据生成方法，包括：
[0005]利用镜头切分模型将样本视频切分为多个镜头片段，得到多个镜头边界伪标签，所述镜头边界伪标签用于指示所述样本视频中包括的镜头边界视频帧；
[0006]删除以所述镜头边界伪标签对应的切分点为中心的第一预设数量的连续视频帧；
[0007]将每个镜头片段中的最后一个视频帧作为真实镜头边界标签；
[0008]将当前的样本视频和真实镜头边界标签作为用于训练目标镜头切分模型的样本数据。
[0009]根据本公开的第二方面，提供了一种样本数据生成装置，包括：
[0010]切分模块，用于利用镜头切分模型将样本视频切分为多个镜头片段，得到多个镜头边界伪标签，所述镜头边界伪标签用于指示所述样本视频中包括的镜头边界视频帧；
[0011]删除模块，用于删除以所述镜头边界伪标签对应的切分点为中心的第一预设数量的连续视频帧；
[0012]标注模块，用于将每个镜头片段中的最后一个...

【技术保护点】

【技术特征摘要】
1.一种样本数据生成方法，包括：利用镜头切分模型将样本视频切分为多个镜头片段，得到多个镜头边界伪标签，所述镜头边界伪标签用于指示所述样本视频中包括的镜头边界视频帧；删除以所述镜头边界伪标签对应的切分点为中心的第一预设数量的连续视频帧；将每个镜头片段中的最后一个视频帧作为真实镜头边界标签；将当前的样本视频和真实镜头边界标签作为用于训练目标镜头切分模型的样本数据。2.根据权利要求1所述的方法，在所述将当前的样本视频和真实镜头边界标签作为用于训练目标镜头切分模型的样本数据之前，所述方法还包括：针对所述多个镜头片段中的任意两个相邻镜头片段，随机删除其中一个镜头片段。3.根据权利要求1或2所述的方法，在所述将当前的样本视频和真实镜头边界标签作为用于训练目标镜头切分模型的样本数据之前，所述方法还包括：对所述多个镜头片段进行随机重排序；或者，将所述样本视频平均分为多个视频段，对至少一个视频段内的镜头片段进行随机重排序；或者，基于所述多个镜头片段之间的相似度，对所述多个镜头片段进行重排序。4.根据权利要求3所述的方法，其中，所述基于所述多个镜头片段之间的相似度，对所述多个镜头片段进行重排序，包括：从所述多个镜头片段中随机选择待排序镜头片段；从所述待排序镜头片段之后的镜头片段中选择一个镜头片段，将所选择的镜头片段移动至所述待排序镜头片段之后且与所述待排序镜头片段相邻的位置；其中，所述待排序镜头片段与所选择的镜头片段之间的相似度处于预设范围内。5.根据权利要求4所述的方法，其中，镜头片段之间的相似度通过以下方式获得：分别抽取两个镜头片段中的关键帧；计算从两个镜头片段中抽取出的关键帧之间的图像相似度，将计算得到的图像相似度作为两个镜头片段之间的相似度。6.根据权利要求1所述的方法，在所述将当前的样本视频和真实镜头边界标签作为用于训练目标镜头切分模型的样本数据之前，所述方法还包括：从所述多个镜头片段中随机选择第一预设比例的镜头片段，针对所选择的每个镜头片段，对该镜头片段内包括的视频帧进行渐变处理。7.根据权利要求1或6所述的方法，在所述将当前的样本视频和真实镜头边界标签作为用于训练目标镜头切分模型的样本数据之前，所述方法还包括：从所述多个镜头片段中随机选择第二预设比例组相邻镜头片段，针对所选择的每组相邻镜头片段，对该组相邻镜头片段中，以排在前的镜头片段的最后一个视频帧为中心的第二预设数量的视频帧进行加权融合处理。8.一种样本数据生成装置，包括：切分模块，用于利用镜头切分模型将样本视频切分为多个镜头片段，得到多个镜头边界伪标签，所述镜头边界伪标签用于指示所述样本视频中包括的镜头边界视频帧；删除模块...

【专利技术属性】
技术研发人员：唐鑫，王冠皓，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人