视频处理、视频分析模型训练、视频分析方法和设备技术

技术编号:37119861 阅读:18 留言:0更新日期:2023-04-01 05:14
本申请提供了一种视频处理、视频分析模型训练、视频分析方法和设备。据本申请实施例,可以对视频数据进行处理和高效率的利用。其中,视频处理方法包括:在第一视频数据的至少一个第一视频帧中,确定第一目标区域;第一视频帧包括目标物体,第一视频帧中的目标物体被划分为多个第一区域,所述第一目标区域包括所述多个第一区域中的至少一个;根据所述第一目标区域,生成视频帧区域块;将所述视频帧区域块,覆盖第二视频数据的至少一个第二视频帧中的第二目标区域,得到处理后的第二视频数据;所述第二视频帧包括所述目标物体,所述第二视频帧中的目标物体被划分为多个第二区域,所述第二目标区域包括与所述第一目标区域对应的至少一个第二区域。一个第二区域。一个第二区域。

【技术实现步骤摘要】
视频处理、视频分析模型训练、视频分析方法和设备


[0001]本申请涉及人工智能
,尤其涉及一种视频处理、视频分析模型训练、视频分析方法和设备。

技术介绍

[0002]随着计算机技术的发展,图像、视频等视频数据处理技术水平不断提高。通过图像、视频处理技术,不仅能够调整图像、视频中物体的形态、质地、大小、光线、美观程度,且处理后的逼真程度也越来越高。同时,图像、视频处理技术可对图像、视频的更改几乎无所不能实现,不仅能够将任意物体变为身体,还能够高度仿造身体、物体真实的行为。如果高度仿造的图像或视频被恶意使用,则会造成一定的不良影响,带来一定的危害。

技术实现思路

[0003]本申请实施例提供一种视频处理、视频分析模型训练、视频分析方法和设备,以实现对使用一定处理手段处理后的视频数据进行分析和识别。
[0004]第一方面,本申请实施例提供了一种视频处理方法,包括:
[0005]在第一视频数据的至少一个第一视频帧中,确定第一目标区域;所述第一视频帧包括目标物体,所述第一视频帧中的目标物体被划分为多个第一区域,所述第一目标区域包括所述多个第一区域中的至少一个;
[0006]根据所述第一目标区域,获得视频帧区域块;
[0007]将所述视频帧区域块,覆盖第二视频数据的至少一个第二视频帧中的第二目标区域,得到处理后的第二视频数据;所述第二视频帧包括所述目标物体,所述第二视频帧中的目标物体被划分为多个第二区域,所述第二目标区域包括与所述第一目标区域对应的至少一个第二区域。
[0008]第二方面,本申请实施例提供了一种视频分析模型训练方法,包括:
[0009]使用训练视频数据样本,对待训练的视频分析模型进行训练,得到训练后的视频分析模型;所述训练视频数据样本包括本申请任意一项实施例提供的处理后的第二视频数据。
[0010]第三方面,本申请实施例提供了一种视频分析方法,采用视频数据分析模型对待处理的视频数据进行分析,根据所述视频数据分析模型的输出结果得到所述视频数据的分析结果,所述视频数据分析模型为本申请任意一项实施例提供的训练后的视频数据分析模型。
[0011]第四方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,处理器在执行计算机程序时实现上述任一项的方法。
[0012]第五方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一项的方法。
[0013]与现有技术相比,本申请具有如下优点:
[0014]能够利用第一视频数据对第二视频数据进行处理,在第二视频数据均为原始视频数据的情况下,可以对第一视频数据中的第一目标区域执行的改变方式存在多种,从而,利用一份原始拍摄获得的第二视频数据就可以创造出大量的处理后的视频数据,在能够利用处理后的视频数据执行机器学习模型训练、深度学习模型训练或者其他研究的场景下,采用少量的原始视频数据,就可以获得大量的处理后的视频数据作为训练样本或研究数据,提高对原始视频数据的利用率。
[0015]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0016]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请的一些实施方式,而不应将其视为是对本申请范围的限制。
[0017]图1A

1D为本申请提供的方法使用场景示意图;
[0018]图2为本申请一实施例的视频处理方法的流程图;
[0019]图3为本申请一实施例的第一视频帧示意图;
[0020]图4为本申请一实施例的视频分析模型训练方法中的预训练操作流程图;
[0021]图5为本申请一实施例的视频分析模型训练方法流程图;
[0022]图6是本申请一实施例的视频处理装置的结构框图;以及
[0023]图7为用来实现本申请实施例的电子设备的框图。
具体实施方式
[0024]在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的构思或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的,而非限制性的。
[0025]为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
[0026]图1A、图1B、图1C和图1D为示例性的用于实现本申请实施例的方法的应用场景的示意图。
[0027]如图1A所示,本申请实施例的视频处理方法可以应用于对存储设备101中存储的视频数据进行处理。存储设备101可以通过网络传输、设备直接传输等方式,将存储的视频数据发送至指定的处理装置102,由处理装置102对视频数据进行分析。针对接收到的每一个视频数据,处理装置创建对应的视频数据处理任务,生成处理后的视频数据,并将处理后的视频数据返回给存储设备101对应的接收模块。存储设备101可以与视频生成设备103通过有线或无线的方式进行连接。在一种实现方式中,存储设备101可以设置有多个,每个存储设备101可以通过有线或无线的方式分别连接对应的视频生成设备103。在另一种实现方式中,存储设备101可以为服务器、数据库、或终端设备的存储模块等。
[0028]在另一种实现方式中,本申请实施例的视频分析模型训练方法可应用于图1B所示的应用场景,其中包括存储设备104、模型训练设备105。存储设备104可以为计算机设备的附属存储设备或专门设置的数据库等用于存储训练样本的设备。计算机设备具体可以为台式电脑、笔记本电脑、掌上电脑、平板电脑、移动通信终端、可穿戴便携设备或服务器等。模型训练设备105也可以为具有计算任务执行功能的设备,比如开放式网络平台、或前述计算机设备。待训练的视频分析模型可以在训练阶段部署在模型训练设备105上,由模型训练设备105根据存储设备104中存储的训练样本,对待训练的视频分析模型进行训练。存储设备104中存储训练样本,训练样本可以是由一个或多个视频获取终端106提供的视频数据,根据视频获取终端106提供的视频数据生成训练样本,并将训练样本存储于存储设备104中。
[0029]在另一种实现方式中,本申请实施例的视频分析方法可应用于图1C所示的应用场景,其中包括视频分析设备107、和需求提交设备108。视频分析设备107可以是具有计算功能的设备,比如台式电脑、笔记本电脑、掌上电脑、平板电脑、移动通信终端、可穿戴便携设备或服务器等。视频分析设备107可部署有视频分析模块,用于执行视频分析的功能。视频分析模块可以是视频分析模型,从而视频分析本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频处理方法,其特征在于,包括:在第一视频数据所包括的至少一个第一视频帧中,确定第一目标区域;所述第一视频帧包括目标物体,所述第一视频帧中的目标物体被划分为多个第一区域,所述第一目标区域包括所述多个第一区域中的至少一个;根据所述第一目标区域,获得视频帧区域块;将所述视频帧区域块,覆盖第二视频数据所包括的至少一个第二视频帧中的第二目标区域,得到处理后的第二视频数据;所述第二视频帧包括所述目标物体,所述第二视频帧中的目标物体被划分为多个第二区域,所述第二目标区域包括与所述第一目标区域对应的至少一个第二区域。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一目标区域,获得视频帧区域块,包括:对所述第一目标区域执行预设处理,得到处理后的第一目标区域;将处理后的第一目标区域内部分第一视频帧,作为所述视频帧区域块;所述预设处理包括下述至少之一:对所述第一目标区域进行部分像素的亮度调整处理;对所述第一目标区域的边界两侧的像素进行对比度调整处理;对所述第一目标区域的边界位置进行更改处理。3.根据权利要求1或2所述的方法,其特征在于,所述目标物体包括脸部和身体中至少一个;所述第一区域为根据所述第一视频帧中的目标物体的特征点之间的连线生成的;所述第二区域为根据所述第二视频帧中的目标物体的特征点之间的连线生成的。4.一种视频分析模型训练方法,其特征在于,包括:使用训练视频数据样本,对待训练的视频分析模型进行训练,得到训练后的视频分析模型;所述训练视频数据样本包括权利要求1

3中任意一项所述的处理后的第二视频数据。5.根据权利要求4所述的方法,其特征在于,所述使用训练视频数据样本,对待训练的视频分析模型进行训练,得到训练后的视频分析模型,包括:获取处理后的第二视频数据;利用所述处理后的第二视频数据,对所述待训练的视频分析模型进行优化,得到优化后的视频分析模型;根据预设的损失函数,确定所述优化后的视频分析模型是否完成训练,若否,返回所述获取所述处理后的第二视频数据的步骤;若是,将所述优化后的视频分析模型作为所述训练后的视频分析模型。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:根据第三视频数据中的第三视频帧,提取目标物体所在的第三区域;将所述第三区域中的至少部分像素的数据进行改变,得到第四区域;根据第四区域反向推导得到第三区域,确定反向推导参数;根据所述反向推导参数确定所述待训练的视频数据分析模型的编码器的参数。7.根据权利要求6所述的方法,其特征在于,所述将所述第三区域中的至少部分像素的数据进行改变,得到第四区域,包括:对所...

【专利技术属性】
技术研发人员:李旭嵘李茂森于鲲
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1