视频信息处理方法、装置及存储介质制造方法及图纸

技术编号:38546805 阅读:12 留言:0更新日期:2023-08-22 20:55
本发明专利技术公开了一种视频信息处理方法、装置及存储介质,先获取待处理视频,再在待处理视频中确定目标帧区间,然后根据目标帧区间中多个连续的待处理视频帧对待处理视频进行数据增强处理,得到包括多个连续的增强视频帧的目标视频,并在目标视频中为多个连续的增强视频帧的起始位置和结束位置分别配置事件切分点标签,接着根据目标视频、事件切分点标签和镜头切分点标签,对视频切分点预测模型进行训练。本发明专利技术实施例可使目标视频能够模拟真实视频样本发生的事件变化,从而能够用于提高模型对视频的切分准确性。本发明专利技术实施例可应用于例如视频信息处理、视频切分点预测等图像处理技术领域中。术领域中。术领域中。

【技术实现步骤摘要】
视频信息处理方法、装置及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种视频信息处理方法、装置及存储介质。

技术介绍

[0002]在相关技术中,对视频进行时序上的切分,是许多视频类任务的一个重要先导环节,例如可以将切分后的视频片段用于视频编辑、视频理解、视频识别、视频拆条等不同的视频类任务。目前常用的视频切分方法是基于深度学习的视频切分方法,通过深度学习模型对视频中的切分点进行预测,从而实现对视频的切分。
[0003]在相关技术中,为了提高深度学习模型对视频的切分准确性,常常会对视频样本进行图像数据增强,弥补训练样本的不足,防止模型出现过拟合现象,从而增强模型的泛化能力。但是,相关技术中的图像数据增强,只是采用几何变换、颜色变换或像素变换等方式对视频样本中的多帧图像进行相同的静态图像数据增强,因此难以进一步提高模型对视频的切分准确性。

技术实现思路

[0004]以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0005]本专利技术实施例提供了一种视频信息处理方法、装置及存储介质,能够使得目标视频可以有效地模拟真实视频样本中发生的事件变化,从而能够用于提高模型对视频的切分准确性。
[0006]一方面,本专利技术实施例提供了一种视频信息处理方法,包括以下步骤:获取待处理视频,所述待处理视频包括多个连续的待处理视频帧;在所述待处理视频中确定目标帧区间;根据所述目标帧区间中多个连续的所述待处理视频帧,对所述待处理视频进行数据增强处理,得到目标视频,所述目标视频包括多个连续的增强视频帧;在所述目标视频中,为所述多个连续的增强视频帧的起始位置和结束位置分别配置事件切分点标签;根据所述目标视频、所述事件切分点标签和镜头切分点标签,对视频切分点预测模型进行训练。
[0007]另一方面,本专利技术实施例还提供了一种视频信息处理装置,包括:视频获取单元,用于获取待处理视频,所述待处理视频包括多个连续的待处理视频帧;帧区间确定单元,用于在所述待处理视频中确定目标帧区间;数据增强单元,用于根据所述目标帧区间中多个连续的所述待处理视频帧,对所述待处理视频进行数据增强处理,得到目标视频,所述目标视频包括多个连续的增强视频
帧;标签配置单元,用于在所述目标视频中,为所述多个连续的增强视频帧的起始位置和结束位置分别配置事件切分点标签;视频处理单元,用于根据所述目标视频、所述事件切分点标签和镜头切分点标签,对视频切分点预测模型进行训练。
[0008]可选地,所述数据增强单元还用于:根据所述目标帧区间中多个连续的所述待处理视频帧,对所述待处理视频进行动态数据增强处理,得到目标视频,所述动态数据增强处理用于使得所述多个连续的增强视频帧发生的变化不同。
[0009]可选地,所述数据增强单元还用于:在所述待处理视频中确定多个连续的待增强视频帧;将所述目标帧区间中多个连续的所述待处理视频帧中的内容,叠加至多个连续的所述待增强视频帧中,以得到多个连续的增强视频帧;将包含所述多个连续的增强视频帧的所述待处理视频作为目标视频。
[0010]可选地,所述数据增强单元还用于:获取所述目标帧区间中多个连续的所述待处理视频帧的图像信息;将多个连续的所述待处理视频帧的图像信息分别叠加至多个连续的所述待增强视频帧中,以得到多个连续的增强视频帧。
[0011]可选地,所述数据增强单元还用于:基于所述目标帧区间中多个连续的所述待处理视频帧,得到多个不同尺寸的目标区域图像;将所述多个不同尺寸的目标区域图像调整为相同尺寸,并将相同尺寸的多个目标区域图像作为所述多个连续的增强视频帧;将所述目标帧区间中多个连续的所述待处理视频帧,替换为所述多个连续的增强视频帧,得到目标视频。
[0012]可选地,所述数据增强单元还用于:对所述多个不同尺寸的目标区域图像进行缩小或者放大的调整,使得所述多个不同尺寸的目标区域图像被调整为相同尺寸。
[0013]可选地,所述数据增强单元还用于:获取所述目标帧区间中多个连续的所述待处理视频帧的局部图像信息;对所述多个连续的所述待处理视频帧的局部图像信息进行光线、色彩或纹理中的至少一种图像参数调整,得到目标视频,其中,所述目标帧区间中不同待处理视频帧对应的图像参数调整的程度不同,经过所述图像参数调整的所述多个连续的所述待处理视频帧为所述多个连续的增强视频帧。
[0014]可选地,所述数据增强单元还用于:在所述目标帧区间中多个连续的所述待处理视频帧中确定候选帧区域;根据所述候选帧区域对所述目标帧区间中多个连续的所述待处理视频帧进行图像截取,得到所述目标帧区间中多个连续的所述待处理视频帧的局部图像信息。
[0015]可选地,所述视频处理单元还用于:
调用所述视频切分点预测模型对所述目标视频进行镜头切分点预测和事件切分点预测,得到镜头切分点结果和事件切分点结果;根据所述镜头切分点结果、所述事件切分点结果、镜头切分点标签和所述事件切分点标签,对所述视频切分点预测模型进行参数调整。
[0016]可选地,所述视频处理单元还用于:调用所述视频切分点预测模型对所述目标视频进行事件切分点预测,得到所述目标视频中各个待处理视频帧的事件切分点概率;将所述事件切分点概率大于第三预设阈值的所述待处理视频帧确定为第三目标样本帧;在所述目标视频中确定第二样本帧区间,将所述第二样本帧区间中的一个视频帧确定为第四目标样本帧,其中,所述第二样本帧区间中的每个所述待处理视频帧的所述事件切分点概率均大于第四预设阈值,所述第四预设阈值小于所述第三预设阈值;根据所述第三目标样本帧和所述第四目标样本帧得到事件切分点结果。
[0017]可选地,所述镜头切分点结果包括至少一个镜头切分点,其中,所述镜头切分点为镜头内容直接跳变的相邻两个待处理视频帧中的一个,或者,所述镜头切分点包括镜头内容渐变的多个连续的待处理视频帧。
[0018]另一方面,本专利技术实施例还提供了一种视频信息处理装置,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当至少一个所述程序被至少一个所述处理器执行时实现如前面所述的视频信息处理方法。
[0019]另一方面,本专利技术实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的计算机程序,所述处理器可执行的计算机程序被处理器执行时用于实现如前面所述的视频信息处理方法。
[0020]另一方面,本专利技术实施例还提供了一种计算机程序产品,包括计算机程序或计算机指令,所述计算机程序或所述计算机指令存储在计算机可读存储介质中,视频信息处理装置的处理器从所述计算机可读存储介质读取所述计算机程序或所述计算机指令,处理器执行计算机程序或计算机指令,使得视频信息处理装置执行如前面的视频信息处理方法。
[0021]本专利技术实施例至少包括以下有益效果:在获取包括多个连续的待处理视频帧的待处理视频之后,先在待处理视频中确定目标帧区间,然后根据目标帧区间中多个连续的待处理视频帧对待处理视频进行数据增强处理,得到包括多个连续的增强视频帧的目标视频本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频信息处理方法,其特征在于,包括以下步骤:获取待处理视频,所述待处理视频包括多个连续的待处理视频帧;在所述待处理视频中确定目标帧区间;根据所述目标帧区间中多个连续的所述待处理视频帧,对所述待处理视频进行数据增强处理,得到目标视频,所述目标视频包括多个连续的增强视频帧;在所述目标视频中,为所述多个连续的增强视频帧的起始位置和结束位置分别配置事件切分点标签;根据所述目标视频、所述事件切分点标签和镜头切分点标签,对视频切分点预测模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标帧区间中多个连续的所述待处理视频帧,对所述待处理视频进行数据增强处理,得到目标视频,包括:根据所述目标帧区间中多个连续的所述待处理视频帧,对所述待处理视频进行动态数据增强处理,得到目标视频,所述动态数据增强处理用于使得所述多个连续的增强视频帧发生的变化不同。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标帧区间中多个连续的所述待处理视频帧,对所述待处理视频进行动态数据增强处理,得到目标视频,包括:在所述待处理视频中确定多个连续的待增强视频帧;将所述目标帧区间中多个连续的所述待处理视频帧中的内容,叠加至多个连续的所述待增强视频帧中,以得到多个连续的增强视频帧;将包含所述多个连续的增强视频帧的所述待处理视频作为目标视频。4.根据权利要求3所述的方法,其特征在于,所述将所述目标帧区间中多个连续的所述待处理视频帧中的内容,叠加至多个连续的所述待增强视频帧中,以得到多个连续的增强视频帧,包括:获取所述目标帧区间中多个连续的所述待处理视频帧的图像信息;将多个连续的所述待处理视频帧的图像信息分别叠加至多个连续的所述待增强视频帧中,以得到多个连续的增强视频帧。5.根据权利要求2所述的方法,其特征在于,所述根据所述目标帧区间中多个连续的所述待处理视频帧,对所述待处理视频进行动态数据增强处理,得到目标视频,包括:基于所述目标帧区间中多个连续的所述待处理视频帧,得到多个不同尺寸的目标区域图像;将所述多个不同尺寸的目标区域图像调整为相同尺寸,并将相同尺寸的多个目标区域图像作为所述多个连续的增强视频帧;将所述目标帧区间中多个连续的所述待处理视频帧,替换为所述多个连续的增强视频帧,得到目标视频。6.根据权利要求5所述的方法,其特征在于,所述将所述多个不同尺寸的目标区域图像调整为相同尺寸,包括:对所述多个不同尺寸的目标区域图像进行缩小或者放大的调整,使得所述多个不同尺寸的目标区域图像被调整为相同尺寸。7.根据权利要求2所述的方法,其特征在于,所述根据所述目标帧区间中多个连续的所
述待处理视频帧,对所述待处理视频进行动态数据增强处理,得到目标视频,包括:获取所述目标帧区间中多个连续的所述待处理视频帧的局部图像信息;对所述多个连续的所述待处理视频帧的局部图像信息进行光线、色彩或纹理中的至少一种图像参数调整,得到目标视频,其中,所述目标帧区间中不同待处理视频帧对应的图像参数调整的程度不同...

【专利技术属性】
技术研发人员:许良晟舒秀军谯睿智
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1