本申请涉及计算机视觉领域,提供了一种视频裁剪方法、装置、计算机设备和计算机可读存储介质,以解决现有技术视频裁剪效率低下或者容易将视频中的关键部分剪掉的问题。所述方法包括:获取待裁剪视频中初始视频帧的感兴趣区域;对初始视频帧之后每一帧视频中的感兴趣区域进行实时追踪;根据对感兴趣区域实时追踪的结果,以感兴趣区域的边缘或围绕感兴趣区域延拓后的边缘为裁剪界限对待裁剪视频的每一帧进行裁剪,得到裁剪后视频;输出裁剪后视频。本发明专利技术的技术方案一方面效率高、成本低,另一方面,在对待裁剪视频进行裁剪时保留了待剪裁视频的重要、关键部分,使得视频裁剪的效果能够满足用户对视频的需求。
Video clip method, device, computer equipment and computer readable storage medium
【技术实现步骤摘要】
视频裁剪方法、装置、计算机设备和计算机可读存储介质
本申请涉及计算机视觉领域,特别涉及一种视频裁剪方法、装置、计算机设备和计算机可读存储介质。
技术介绍
在关于商品广告类的视频处理领域,通过图片优选得到某个商品的很多优质图片,然后以图片切换的方式将这些图片做成视频,展现这些图片,或者,针对某个商品拍成视频,然后配合预先定义好的模版,对这些原始视频进行优化,可以得到视频动态商品广告(DynamicProductAdvertisement,DPA)。一般而言,针对某个商品拍摄制作出来的视频PAD,其规格固定单一。若要使该视频能够适应不同的广告位规格要求,则必须对视频的规格进行裁剪。目前,对视频PAD进行裁剪的方法包括人工裁剪和计算机辅助裁剪,其中,计算机辅助裁剪主要是对视频的上下或者左右区域进行均匀裁剪。然而,由于视频DPA的数量一般较大,面对海量的视频,人工裁剪效率低下,成本高昂,而对视频进行均匀裁剪的方法,则容易将视频中的关键部分,例如,商品本身的图像给剪掉。
技术实现思路
本申请实施例提供了一种视频裁剪方法、装置、计算机设备和计算机可读存储介质,以解决现有技术视频裁剪效率低下或者容易将视频中的关键部分剪掉的问题。该技术方案如下:一方面,提供了一种视频裁剪方法,该方法包括:获取待裁剪视频中初始视频帧的感兴趣区域;对所述初始视频帧之后每一帧视频中的所述感兴趣区域进行实时追踪;根据对所述感兴趣区域实时追踪的结果,以所述感兴趣区域的边缘或围绕所述感兴趣区域延拓后的边缘为裁剪界限对所述待裁剪视频的每一帧进行裁剪,得到裁剪后视频;输出所述裁剪后视频。一方面,提供了一种视频裁剪装置,该装置包括:获取模块,用于获取待裁剪视频中初始视频帧的感兴趣区域;目标追踪模块,用于对所述初始视频帧之后每一帧视频中的所述感兴趣区域进行实时追踪;裁剪模块,用于根据对所述感兴趣区域实时追踪的结果,以所述感兴趣区域的边缘或围绕所述感兴趣区域延拓后的边缘为裁剪界限对所述待裁剪视频的每一帧进行裁剪,得到裁剪后视频;输出模块,用于输出所述裁剪后视频。一方面,提供了一种计算机设备,该计算设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,该计算机程序代码由该一个或多个处理器加载并执行以实现该视频裁剪方法所执行的操作。一方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序由处理器加载并执行以实现该视频裁剪方法所执行的操作。由上述本申请提供的技术方案可知,一方面,由于感兴趣区域的获取、实时追踪和根据感兴趣区域实时追踪的结果裁剪待裁剪视频皆由计算机程序执行,因此,相对于现有技术需要对海量视频进行人工裁剪的方案,本申请提供的技术方案效率高、成本低;另一方面,在实时追踪到感兴趣区域后,以感兴趣区域的边缘为裁剪界限对待裁剪视频进行裁剪,则保留了待剪裁视频的重要、关键部分,使得视频裁剪的效果能够满足用户对视频的需求。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种视频裁剪方法的实施环境示意图;图2是本申请实施例提供的一种视频裁剪方法的流程图;图3是本申请实施例提供的对初始视频帧之后每一帧视频中的感兴趣区域进行实时追踪的流程图;图4是本申请另一实施例提供的对初始视频帧之后每一帧视频中的感兴趣区域进行实时追踪的流程图;图5是本申请另一实施例提供的对初始视频帧之后每一帧视频中的感兴趣区域进行实时追踪的流程图;图6a是本申请实施例提供的以感兴趣区域的边缘或围绕感兴趣区域延拓后的边缘为裁剪界限对待裁剪视频的每一帧进行裁剪示意图;图6b是本申请另一实施例提供的以感兴趣区域的边缘或围绕感兴趣区域延拓后的边缘为裁剪界限对待裁剪视频的每一帧进行裁剪示意图;图7是本申请实施例提供的根据对感兴趣区域实时追踪的结果,以感兴趣区域的边缘为裁剪界限对待裁剪视频的每一帧进行裁剪的流程图;图8a是本申请实施例提供的一段包含6个视频帧的视频示意图;图8b是现有技术对图8a示例的视频进行裁剪后的示意图;图8c是本申请的技术方案对图8a示例的视频进行裁剪后的示意图;图9是本申请实施例提供的一种视频裁剪装置的结构示意图;图10是本申请实施例提供的一种计算机设备的结构示意图;图11是本申请实施例提供的一种区块链系统的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。计算机视觉(ComputerVision,CV)是一门研究如何使机器“看”的科学,进一步地说,就是指应用摄影机和电脑等计算机设备代替人眼对图像中的目标对象进行识别、跟踪和测量等,还可以对图像做进一步处理,使处理后的图像更适合人眼观察或更便于传送给其他设备进行检测。计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常可以包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还可以包括常见的人脸识别、指纹识别等生物特征识别技术。本申请实施例提供的方案主要涉及计算机视觉技术中的图像识别、视频处理以及目标追踪等技术,通过图像识别、视频处理以及目标追踪等技术,定位视频中的目标对象,以实现对视频关键部分的实时跟踪,从而在后续对视频裁剪时能够保留视频中的关键信息,具体可以通过下述实施例进行说明。附图1是本申请实施例提供的一种视频裁剪方法的实施环境示意图,该实施环境中包括终端110和服务器140。终端110通过无线网络或有线网络与服务器110相连。终端110可以是智能手机、平板电脑、便携计算机等设备。终端110安装和运行有支持视频裁剪技术的应用程序。该应用程序可以是摄影类应用程序、视频处理类应用程序等。示例性的,终端110是用户使用的终端,终端110中运行的应用程序内登录有用户账号。终端110通过无线网络或有线网络与服务器140相连。服务器140可以是云计算平台、虚拟化中心等。服务器140用于为支持视频裁剪技术的应用程序提供后台服务。可选地,服务器140承担主要视频裁剪工作,终端110承担次要视频裁剪工作;或者,服务器140承担次要视频裁剪工作,终端110承担主要视频裁剪工作;或者,服务器140或终端110分别可以单独承担视频裁剪工作。可选地,服务器140包括:接入服务器、视频识别服务器和数据库。接入服务器用于为终端110提供接入服务。视频识别服务器用于提供视频本文档来自技高网...
【技术保护点】
1.一种视频裁剪方法,其特征在于,所述方法包括:/n获取待裁剪视频中初始视频帧的感兴趣区域;/n对所述初始视频帧之后每一帧视频中的所述感兴趣区域进行实时追踪;/n根据对所述感兴趣区域实时追踪的结果,以所述感兴趣区域的边缘或围绕所述感兴趣区域延拓后的边缘为裁剪界限对所述待裁剪视频的每一帧进行裁剪,得到裁剪后视频;/n输出所述裁剪后视频。/n
【技术特征摘要】
1.一种视频裁剪方法,其特征在于,所述方法包括:
获取待裁剪视频中初始视频帧的感兴趣区域;
对所述初始视频帧之后每一帧视频中的所述感兴趣区域进行实时追踪;
根据对所述感兴趣区域实时追踪的结果,以所述感兴趣区域的边缘或围绕所述感兴趣区域延拓后的边缘为裁剪界限对所述待裁剪视频的每一帧进行裁剪,得到裁剪后视频;
输出所述裁剪后视频。
2.如权利要求1所述视频裁剪方法,其特征在于,所述对所述初始视频帧之后每一帧视频中的所述感兴趣区域进行实时追踪,包括:
基于所述感兴趣区域的特征点检测结果,将所述感兴趣区域分割为多个子区域;
获取所述感兴趣区域被分割的多个子区域的每个子区域的移动方向偏置量;
基于所述每个子区域的移动方向偏置量,预测所述感兴趣区域在当前视频帧的下一帧视频中的移动方向信息。
3.如权利要求2所述视频裁剪方法,其特征在于,所述根据对所述感兴趣区域实时追踪的结果,以所述感兴趣区域的边缘或围绕所述感兴趣区域延拓后的边缘为裁剪界限对所述待裁剪视频的每一帧进行裁剪,得到裁剪后视频,包括:
根据所述感兴趣区域在所述下一帧视频中的移动方向信息,在与所述感兴趣区域移动方向相反的方向,以所述感兴趣区域的边缘或围绕所述感兴趣区域延拓后的边缘为裁剪界限对所述下一帧视频进行裁剪,得到裁剪后视频。
4.如权利要求1所述视频裁剪方法,其特征在于,所述对所述初始视频帧之后每一帧视频中的所述感兴趣区域进行实时追踪,包括:
判断当前视频帧之后的下一帧视频中是否存在与所述感兴趣区域相异程度满足预设阈值的区域;
若所述当前视频帧之后的下一帧视频中存在与所述感兴趣区域相异程度满足预设阈值的区域,则将与所述感兴趣区域相异程度满足所述预设阈值的区域位置确认为所述感兴趣区域在当前视频帧的下一帧视频的位置。
5.如权利要求1所述视频裁剪方法,其特征在于,所述对所述初始视频帧之后每一帧视频中的所述感兴趣区域进行实时追踪,包括:
利用神经网络检测所述感兴趣区域在当前视频帧的检测位置信息...
【专利技术属性】
技术研发人员:李少波,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。