视频裁剪系统、方法及相关装置制造方法及图纸

技术编号:35243182 阅读:25 留言:0更新日期:2022-10-19 09:49
公开了一种视频裁剪方法,其特征在于,应用于视频裁剪系统,包括电子设备和服务器,所述方法包括:电子设备获取原始的待裁剪视频,在电子设备上完成简单的切分场景镜头的计算,并提取场景镜头的关键帧;电子设备上传场景镜头的关键帧图片到服务器,服务器基于接收到的关键帧,确定每个场景镜头的裁剪区域的位置信息;服务器将包含裁剪区域的位置信息的配置文件发送给电子设备;电子设备基于该配置文件实现对原始的待裁剪视频的裁剪。本申请实施例通过端云结合的方式,分别在端侧(电子设备)和云侧(服务器)完成简单的切分场景镜头处理和复杂的计算,实现了电子设备在低计算资源,低流量消耗的条件下实现视频裁剪。量消耗的条件下实现视频裁剪。量消耗的条件下实现视频裁剪。

【技术实现步骤摘要】
视频裁剪系统、方法及相关装置


[0001]本申请涉及电子
,尤其涉及一种视频裁剪系统、方法及相关装置。

技术介绍

[0002]视频剪辑是指因互联网视频和新媒体短视频内容平台的需要,对电视剧、电影等影视作品进行二次加工,将原来的视频素材按照特定需要制作成新的视频。随着折叠屏等智能终端设备的普及,终端设备全屏播放视频的尺寸也愈加丰富。此外,近年短小视频的兴起,吸引手机用户习惯在竖屏状态下观看视频内容。虽然理论上横屏视频展示的影视作品更完整,但手机单手操作即可播放视频的便捷性需求倒逼着一些视频内容竖屏化。
[0003]目前,若直接通过缩放处理再竖屏状态播放,会出现手机屏幕上下都是黑边的情况,用户观看体验较差。若是通过人工剪辑,也会加重企业的运营成本。因此,如何在保留视频主体内容的前提下将横版视频裁剪成竖版视频是本领域技术人员正在研究的问题。

技术实现思路

[0004]本申请实施例提供了一种视频裁剪系统、方法及相关装置,可以从横版视频画面中截取适合竖版视频的内容区域,且能够解决现有技术中不易在低计算资源终端应用、云侧部署耗费流量大的问题。
[0005]第一方面,本申请提供了一种视频裁剪系统,该视频裁剪系统包括电子设备和服务器;
[0006]电子设备用于获取待裁剪视频;
[0007]电子设备还用于将待裁剪视频分割为一个或多个场景镜头;
[0008]电子设备还用于提取一个或多个场景镜头中每个场景镜头的关键帧,每个场景镜头至少包括一个关键帧;
[0009]电子设备还用于将每个场景镜头的关键帧发送给服务器;
[0010]服务器用于基于接收到的关键帧,确定一个或多个场景镜头中每个场景镜头的裁剪区域的位置信息;
[0011]服务器还用于将包含裁剪区域的位置信息的配置文件发送给电子设备;
[0012]电子设备还用于基于配置文件对待裁剪视频进行裁剪。
[0013]本申请实施例,通过端云结合的方式,分别在端侧(电子设备)和云侧(服务器)完成简单的切分场景镜头处理和复杂的计算,实现了电子设备在低计算资源,低流量消耗的条件下实现视频裁剪。电子设备上存储了原始视频,在电子设备上完成简单的切分场景镜头的计算;电子设备上传场景镜头的关键帧图片到服务器,在服务器完成复杂的内容理解;服务器回传包含关键帧的时间信息和裁剪区域的位置信息的配置文件,电子设备基于该配置文件实现对原始视频的裁剪。这样,大大降低了对电子设备的计算要求和端云通信所带来的流量消耗,让视频裁剪能力可以在中低端设备进行应用。
[0014]在一些可能的实施方式中,服务器用于基于接收到的关键帧,确定一个或多个场
景镜头中每个场景镜头的裁剪区域的位置信息,包括:服务器还用于基于接收到的关键帧,识别一个或多个场景镜头中每个场景镜头的场景类型,一个或多个场景镜头包括第一场景镜头;服务器,还用于若第一场景镜头的场景类型为第一场景类型,则基于第一策略确定第一场景镜头的裁剪区域的位置信息;服务器还用于若第一场景镜头的场景类型为第二场景类型,则基于第二策略确定第一场景镜头的裁剪区域的位置信息。
[0015]在一些可能的实施方式中,服务器还用于基于接收到的关键帧,识别一个或多个场景镜头中每个场景镜头的场景类型,包括:服务器还用于对接收到的关键帧进行人脸检测和物体检测,识别出人脸区域和物体区域,以及人脸区域中的人脸标识和物体区域中的物体标识;服务器还用于若识别出第一场景镜头的关键帧中,超过预设数值的关键帧存在人脸区域或物体区域,则确定第一场景镜头的场景类型为第一场景类型;服务器还用于若识别出第一场景镜头的关键帧中,没有超过预设数值的关键帧存在人脸区域或物体区域,则确定第一场景镜头的场景类型为第二场景类型。
[0016]在一些可能的实施方式中,第一场景镜头的裁剪区域中包括第一场景镜头的关键帧中的人脸区域和物体区域。
[0017]在一些可能的实施方式中,一个或多个场景镜头包括第二场景镜头和第三场景镜头,第二场景镜头的关键帧有N个,第三场景镜头的关键帧有N个;电子设备,还用于检测网络质量,其中,第一时刻的网络质量优于第二时刻的网络质量;电子设备,还用于在第一时刻确定将第二场景镜头的M个关键帧发送给服务器;电子设备,还用于在第二时刻确定将第三场景镜头的K个关键帧发送给服务器,其中,N、M、K均为正整数,M小于或等于N,K小于M。电子设备基于当前的网络质量,确定传输每个场景镜头关键帧的数量。即使电子设备采集了第二场景镜头的10个关键帧和第三场景镜头的10个关键帧,在第一时刻确定传输8个第二场景镜头的关键帧给服务器,若下一个时刻第二时刻的网络质量不如第一时刻,则在第二时刻确定传输6个第三场景镜头的关键帧给服务器。这样,可以节省通信过程中的流量消耗,在视频关键帧在传输之前可以检测当前的网络质量,包括检测当前网络带宽、数据的实际传输速度等。可选的,数据的实际传输速度越大,则当前的网络质量越好。
[0018]在一些可能的实施方式中,电子设备基于当前的网络质量,确定传输每个关键帧图片的分辨率。若第一时刻的网络质量好于第二时刻的网络质量,则第一时刻电子设备100向服务器101传输关键帧图片的分辨率大于第二时刻电子设备100向服务器101传输关键帧图片的分辨率。例如第一时刻传输的关键帧图片的分辨率为1920*1080,第二时刻传输的关键帧图片的分辨率为480*270。
[0019]在一些可能的实施方式中,电子设备还用于接收输入的目标标识;电子设备还用于将目标标识发送给服务器;服务器还用于检测到第二场景镜头的关键帧的人脸标识或物体标识中包括目标标识,则确定目标标识对应的人脸区域或物体区域在第二场景镜头的裁剪区域之中。通过用户指定感兴趣主体信息以及预置人物标识能力实现画面焦点的自动选取。用户可以指定感兴趣的主体信息或者按照系统默认添加的人脸识别,进行优先裁剪。可以按照用户需求或者人物标识来区分原始视频的主体信息。
[0020]在一些可能的实施方式中,电子设备,还用于接收到针对配置文件的修改操作;电子设备,还用于基于修改后的配置文件对待裁剪视频进行裁剪。对于裁剪后的视频,电子设备提供了对配置文件的修改功能,用户可以通过该配置文件对场景镜头或关键帧图片的时
间点进行修改,实现了用户对视频文件的自定义裁剪。
[0021]第二方面,本申请提供了一种视频裁剪方法,该方法包括:电子设备获取待裁剪视频;
[0022]电子设备将待裁剪视频分割为一个或多个场景镜头;电子设备提取一个或多个场景镜头中每个场景镜头的关键帧,每个场景镜头至少包括一个关键帧;电子设备将每个场景镜头的关键帧发送给服务器;电子设备接收服务器发送的配置文件,配置文件中包括服务器基于接收到的关键帧,确定出的一个或多个场景镜头中每个场景镜头的裁剪区域的位置信息;电子设备基于配置文件对待裁剪视频进行裁剪。
[0023]本申请实施例,电子设备中存储有原始的横版视频资源。电子设备首先会对原始视频进行场景分割,得到一个或多个场景镜头。然后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频裁剪系统,其特征在于,包括电子设备和服务器;所述电子设备,用于获取待裁剪视频;所述电子设备,还用于将所述待裁剪视频分割为一个或多个场景镜头;所述电子设备,还用于提取所述一个或多个场景镜头中每个场景镜头的关键帧,所述每个场景镜头至少包括一个关键帧;所述电子设备,还用于将所述每个场景镜头的关键帧发送给所述服务器;所述服务器,用于基于接收到的所述关键帧,确定所述一个或多个场景镜头中每个场景镜头的裁剪区域的位置信息;所述服务器,还用于将包含所述裁剪区域的位置信息的配置文件发送给所述电子设备;所述电子设备,还用于基于所述配置文件对所述待裁剪视频进行裁剪。2.根据权利要求1所述的系统,其特征在于,所述服务器,用于基于接收到的所述关键帧,确定所述一个或多个场景镜头中每个场景镜头的裁剪区域的位置信息,包括:所述服务器,还用于基于接收到的所述关键帧,识别所述一个或多个场景镜头中每个场景镜头的场景类型,所述一个或多个场景镜头包括第一场景镜头;所述服务器,还用于若第一场景镜头的场景类型为第一场景类型,则基于第一策略确定所述第一场景镜头的裁剪区域的位置信息;所述服务器,还用于若第一场景镜头的场景类型为第二场景类型,则基于第二策略确定所述第一场景镜头的裁剪区域的位置信息。3.根据权利要求2所述的系统,其特征在于,所述服务器,还用于基于接收到的所述关键帧,识别所述一个或多个场景镜头中每个场景镜头的场景类型,包括:所述服务器,还用于对接收到的所述关键帧进行人脸检测和物体检测,识别出人脸区域和物体区域,以及所述人脸区域中的人脸标识和所述物体区域中的物体标识;所述服务器,还用于若识别出所述第一场景镜头的关键帧中,超过预设数值的关键帧存在人脸区域或物体区域,则确定所述第一场景镜头的场景类型为所述第一场景类型;所述服务器,还用于若识别出所述第一场景镜头的关键帧中,没有超过所述预设数值的关键帧存在人脸区域或物体区域,则确定所述第一场景镜头的场景类型为所述第二场景类型。4.根据权利要求3所述的系统,其特征在于,所述第一场景镜头的裁剪区域中包括所述第一场景镜头的关键帧中的人脸区域和物体区域。5.根据权利要求1所述的系统,其特征在于,所述一个或多个场景镜头包括第二场景镜头和第三场景镜头,所述第二场景镜头的关键帧有N个,所述第三场景镜头的关键帧有N个;所述电子设备,还用于检测网络质量,其中,第一时刻的网络质量优于第二时刻的网络质量;所述电子设备,还用于在所...

【专利技术属性】
技术研发人员:陈坤徐威洪裕珍姜磊
申请(专利权)人:花瓣云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1