一种视频处理方法、视频处理装置及终端设备制造方法及图纸

技术编号:21914552 阅读:24 留言:0更新日期:2019-08-21 12:36
本发明专利技术适用于图像处理技术领域,提供了一种视频处理方法、视频处理装置及终端设备,所述视频处理方法,包括:获取待处理视频;确定所述待处理视频中的每一视频帧的场景类别;根据每一视频帧的场景类别,通过训练后的第一深度学习模型对所述待处理视频中的每一视频帧进行目标识别,获得目标识别结果,其中,所述目标识别结果指示每一视频帧中是否包含目标物体,所述目标物体与所述场景类别相对应;根据所述目标识别结果,识别所述待处理视频的多个目标帧,其中,所述目标帧中包含所述目标物体;根据每一目标帧在所述待处理视频中的时间先后顺序,依次将多个所述目标帧进行组合,得到所述目标视频。

A Video Processing Method, Video Processing Device and Terminal Equipment

【技术实现步骤摘要】
一种视频处理方法、视频处理装置及终端设备
本专利技术属于图像处理
,尤其涉及一种视频处理方法、视频处理装置及终端设备。
技术介绍
目前,视频图像技术在多个领域(如视频监控、移动终端以及社交平台等等)广泛应用,并在应用过程中产生了大量的视频文件。这些视频文件往往包含大量的冗余或者不重要的部分,并且这些视频文件的时长往往很长,导致用户需要花很长的时间才能从所述视频文件中查询到所需的关键信息。例如,用户需要从时长为24个小时的监控视频中查询到某个个体在执行指定活动的视频部分,而目前,用户可以采取的方式是对视频文件进行快进播放,并可以将看到的某个个体在执行指定活动的视频部分所对应的时间进行标记,以在后续使用中根据对应的时间从所述视频文件中查找所需的视频部分。但由于视频文件中大量的冗余或者不重要的部分的存在,这样查询视频中的关键信息的方式耗时较长,用户难以高效地提取到视频中的一些关键信息。
技术实现思路
有鉴于此,本专利技术实施例提供了一种视频处理方法、视频处理装置及终端设备,可以识别并提取视频中的关键信息(如识别并提取出包含目标个体的视频部分),从而提高了用户获取视频中的关键信息的效率。本专利技术实施例的第一方面提供了一种视频处理方法,包括:获取待处理视频;确定所述待处理视频中的每一视频帧的场景类别;根据每一视频帧的场景类别,通过训练后的第一深度学习模型对所述待处理视频中的每一视频帧进行目标识别,获得目标识别结果,其中,所述目标识别结果指示每一视频帧中是否包含目标物体,所述目标物体与所述场景类别相对应;根据所述目标识别结果,识别所述待处理视频的多个目标帧,其中,所述目标帧中包含所述目标物体;根据每一目标帧在所述待处理视频中的时间先后顺序,依次将多个所述目标帧进行组合,得到所述目标视频。本专利技术实施例的第二方面提供了一种视频处理装置,包括:获取模块,用于获取待处理视频;确定模块,用于确定所述待处理视频中的每一视频帧的场景类别;第一识别模块,用于根据每一视频帧的场景类别,通过训练后的第一深度学习模型对所述待处理视频中的每一视频帧进行目标识别,获得目标识别结果,其中,所述目标识别结果指示每一视频帧中是否包含目标物体,所述目标物体与所述场景类别相对应;第二识别模块,用于根据所述目标识别结果,识别所述待处理视频的多个目标帧,其中,所述目标帧中包含所述目标物体;处理模块,用于根据每一目标帧在所述待处理视频中的时间先后顺序,依次将多个所述目标帧进行组合,得到所述目标视频。本专利技术实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术实施例中,获取待处理视频;确定所述待处理视频中的每一视频帧的场景类别;根据每一视频帧的场景类别,通过训练后的第一深度学习模型对所述待处理视频中的每一视频帧进行目标识别,获得目标识别结果,其中,所述目标识别结果指示每一视频帧中是否包含目标物体,所述目标物体与所述场景类别相对应;根据所述目标识别结果,识别所述待处理视频的多个目标帧,其中,所述目标帧中包含所述目标物体;根据每一目标帧在所述待处理视频中的时间先后顺序,依次将多个所述目标帧进行组合,得到所述目标视频。本专利技术实施例通过确定每一视频帧的场景类别,并通过训练后的深度学习模型确定各个视频帧中是否存在该场景类别所对应的目标物体,可以根据不同的场景类别进行有针对性的目标识别,使得目标识别结果更有针对性,干扰更少;根据所述目标识别结果,识别所述待处理视频的多个目标帧,并根据所述目标帧获得目标视频,可以准确高效地提取到所述待处理视频中的关键信息(如识别并提取出包含目标个体的图像部分),并获得由关键信息组成的目标视频,而删除了待处理视频中冗余的、不重要的视频内容,保留了有价值的视频内容,从而在诸如对监控视频的关键信息查找等应用场景中,用户可以根据所述目标视频进行更高效、更有针对性的处理,无需人工对关键信息进行查找、剪辑再合成等操作。本专利技术实施例大大提高了用户获取视频中的关键信息的效率,实用性和易用性较强。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的视频处理方法的实现流程示意图;图2是本专利技术实施例二提供的视频处理方法的实现流程示意图;图3是本专利技术实施例三提供的视频处理装置的示意图;图4是本专利技术实施例四提供的终端设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。图1是本专利技术实施例一提供的视频处理方法的实现流程示意图,如图1所示该视频处理方法可以包括以下步骤:步骤S101,获取待处理视频。所述待处理视频可以是进行了音视频编码的文件,所述待处理视频的编码方式是已知的,并且,所述编码方式是训练数据中所包含的编码方式,其中,所述训练数据用于训练深度学习模型。当然,所述待处理视频也可以是未进行编码的视频,其中每一帧图像均包含完整的图像像素信息。步骤S102,确定所述待处理视频中的每一视频帧的场景类别。本专利技术实施例中,可以通过多种方式确定所述视频帧的场景类别。例如,可以通过预设深度学习模型确定所述视频帧的场景类别,需要说明的是,该预设深度学习模型可以与步骤S103中所述的训练后的第一深度学习模型相同,也可以不同;该预设深度学习模型可以逐本文档来自技高网...

【技术保护点】
1.一种视频处理方法,其特征在于,包括:获取待处理视频;确定所述待处理视频中的每一视频帧的场景类别;根据每一视频帧的场景类别,通过训练后的第一深度学习模型对所述待处理视频中的每一视频帧进行目标识别,获得目标识别结果,其中,所述目标识别结果指示每一视频帧中是否包含目标物体,所述目标物体与所述场景类别相对应;根据所述目标识别结果,识别所述待处理视频的多个目标帧,其中,所述目标帧中包含所述目标物体;根据每一目标帧在所述待处理视频中的时间先后顺序,依次将多个所述目标帧进行组合,得到所述目标视频。

【技术特征摘要】
1.一种视频处理方法,其特征在于,包括:获取待处理视频;确定所述待处理视频中的每一视频帧的场景类别;根据每一视频帧的场景类别,通过训练后的第一深度学习模型对所述待处理视频中的每一视频帧进行目标识别,获得目标识别结果,其中,所述目标识别结果指示每一视频帧中是否包含目标物体,所述目标物体与所述场景类别相对应;根据所述目标识别结果,识别所述待处理视频的多个目标帧,其中,所述目标帧中包含所述目标物体;根据每一目标帧在所述待处理视频中的时间先后顺序,依次将多个所述目标帧进行组合,得到所述目标视频。2.如权利要求1所述的视频处理方法,其特征在于,若所述待处理视频的视频帧中包含目标物体,则所述目标识别结果还指示所述目标物体所在的区域和/或特征点位置;相应的,所述根据所述目标识别结果,识别所述待处理视频的多个目标帧,包括:根据所述目标识别结果所指示的所述目标物体所在的区域和/或特征点位置,判断所述待处理视频中的每一视频帧是否符合第一预设条件;将符合所述第一预设条件的视频帧确定为所述待处理视频的目标帧。3.如权利要求2所述的视频处理方法,其特征在于,所述根据所述目标识别结果所指示的目标物体所在的位置,判断所述待处理视频中的每一视频帧是否符合第一预设条件,包括:针对所述待处理视频中包含所述目标物体的每一视频帧,根据所述目标识别结果所指示的目标物体所在的区域和/或特征点位置,判断所述视频帧中,所述目标物体相对于该视频帧的上一视频帧中或者下一视频帧中的目标物体所在的区域和/或特征点位置的差异程度是否符合第一预设条件;相应的,所述将符合所述第一预设条件的视频帧确定为所述待处理视频的目标帧,包括:若所述视频帧中,所述目标物体相对于该视频帧的上一视频帧中或者下一视频帧中的目标物体所在的区域和/或特征点位置的差异程度符合第一预设条件,则将该视频帧作为所述待处理视频的目标帧。4.如权利要求1所述的视频处理方法,其特征在于,所述确定所述待处理视频中的每一视频帧的...

【专利技术属性】
技术研发人员:孟桂国
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1