【技术实现步骤摘要】
视频处理及模型训练方法、装置、设备和存储介质
[0001]本公开涉及人工智能
,具体涉及视频处理、深度学习、计算机视觉等
,尤其涉及一种视频处理及模型训练方法、装置、设备和存储介质。
技术介绍
[0002]随着智能设备和短视频技术的发展,可以在视频中选择一个视频片段作为封面,由于该封面是视频片段,可以称为视频封面。
[0003]需要解决如何获得效果更好的视频封面的问题。
技术实现思路
[0004]本公开提供了一种视频处理及模型训练方法、装置、设备和存储介质。
[0005]根据本公开的一方面,提供了一种视频处理方法,包括:将视频切分为至少一个视频片段;针对所述至少一个视频片段中的目标视频片段,提取所述目标视频片段的视频表示特征;以及,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的多个子评价信息中的各个子评价信息;针对所述目标视频片段,基于所述目标视频片段的所述各个子评价信息,确定所述目标视频片段的总评价信息;基于所述目标视频片段的总评价信息,确定视频封面。
[0006]根据本公开的另一方面,提供了一种视频处理模型的训练方法,所述模型包括:特征提取网络和多个分支网络,所述方法包括:将视频样本切分为至少一个视频片段;针对所述至少一个视频片段中的目标视频片段,采用所述特征提取网络,提取所述目标视频片段的视频表示特征;以及,采用所述多个分支网络中的各个分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的多个预测信息中的各个预测信息;基于所述各个预测 ...
【技术保护点】
【技术特征摘要】
1.一种视频处理方法,包括:将视频切分为至少一个视频片段;针对所述至少一个视频片段中的目标视频片段,提取所述目标视频片段的视频表示特征;以及,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的多个子评价信息中的各个子评价信息;针对所述目标视频片段,基于所述目标视频片段的所述各个子评价信息,确定所述目标视频片段的总评价信息;基于所述目标视频片段的总评价信息,确定视频封面。2.根据权利要求1所述的方法,其中,所述将视频切分为至少一个视频片段,包括:采用镜头切分网络,对所述视频进行切分处理,以获得所述至少一个视频片段,其中,视频片段包括同一个镜头下的预设帧数的图像。3.根据权利要求1或2所述的方法,其中,所述提取所述目标视频片段的视频表示特征;以及,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的多个子评价信息中的各个子评价信息,包括:采用视频处理模型的特征提取网络,提取所述目标视频片段的视频表示特征;采用所述视频处理模型的多个分支网络中的各个分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的所述各个子评价信息。4.根据权利要求3所述的方法,其中,所述多个子评价信息包括:视频质量分数和出镜率分数;所述多个分支网络包括:第一分支网络和第二分支网络;所述采用所述视频处理模型的多个分支网络中的各个分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的所述各个子评价信息,包括:采用所述第一分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的视频质量分数;采用所述第二分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的视频分类特征;以及,基于所述目标视频片段的视频分类特征,确定所述目标视频片段的出镜率分数。5.根据权利要求4所述的方法,其中,所述基于所述目标视频片段的视频分类特征,确定所述目标视频片段的出镜率分数,包括:基于所述视频分类特征,对所述目标视频片段进行聚类处理,以获得至少一个聚类簇;针对所述至少一个聚类簇中的目标聚类簇内,基于所述目标聚类簇对应的镜头数,确定所述目标视频片段的出镜率分数。6.根据权利要求5所述的方法,其中,所述总评价信息是总分数,所述总分数基于所述视频质量分数和所述出镜率分数获得;所述基于所述目标视频片段的总评价信息,确定视频封面,包括:针对所述目标聚类簇,基于所述目标聚类簇包括的目标视频片段的总分数,确定所述目标聚类簇对应的视频封面。7.一种视频处理模型的训练方法,所述模型包括:特征提取网络和多个分支网络,所述
方法包括:将视频样本切分为至少一个视频片段;针对所述至少一个视频片段中的目标视频片段,采用所述特征提取网络,提取所述目标视频片段的视频表示特征;以及,采用所述多个分支网络中的各个分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的多个预测信息中的各个预测信息;基于所述各个预测信息及其对应的各个真实信息,构建损失函数;基于所述损失函数,调整所述特征提取网络的模型参数和所述各个分支网络的模型参数中的至少一项,直至满足预设条件。8.根据权利要求7所述的方法,其中,所述将视频样本切分为至少一个视频片段,包括:采用镜头切分网络,对所述视频样本进行切分处理,以获得所述至少一个视频片段,其中,视频片段包括同一个镜头下的预设帧数的图像。9.根据权利要求7或8所述的方法,其中,所述多个预测信息包括:预测视频质量分数和预测视频分类特征;所述多个分支网络包括:第一分支网络和第二分支网络;所述采用所述多个分支网络中的各个分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的多个预测信息中的各个预测信息,包括:采用所述第一分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的预测视频质量分数;采用所述第二分支网络,基于所述目标视频片段的视频表示特征,确定所述目标视频片段的预测视频分类特征。10.一种视频处理装置,包括:切分模块,用于将视频切分为至少一个视频片段;第一确定模块,用于针对所述至少一个视频片段中的目标视频片段,提取所述目标视...
【专利技术属性】
技术研发人员:陈波,王冠皓,唐鑫,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。