视频识别方法和装置制造方法及图纸

技术编号:15691420 阅读:57 留言:0更新日期:2017-06-24 04:36
本公开是关于一种视频识别方法和装置,通过获取目标视频;根据第一预设帧间隔,对目标视频进行划分,得到多个视频片断;根据第二预设帧间隔,从每个视频片断中提取出第一帧图像;将包含有人脸信息的第一帧图像提取出来,得到第二人脸帧图像;基于预设识别模型,对第二人脸帧图像中的人脸身份进行识别,确定第二人脸帧图像中包含的人脸标识;根据人脸标识与第二人脸帧图像的对应关系,根据第二人脸帧图像与第二人脸帧图像所归属的视频片断的对应关系,形成人脸标识、第二人脸帧图像、视频片断的三方对应关系表。从而可以根据确定出的视频片断与人脸标识的对应关系,为用户推送仅包含有其所希望观看的演员出场的视频片断。

Video identification method and apparatus

The public is a video identification method and apparatus, by acquiring the target video; according to the first preset frame interval, to divide the target video, get multiple video clips; according to the second preset frame interval, from each video clips to extract the first frame of the image; the first frame image containing facial information extracted. Second face image; the preset identification model based on the identification of human face identity second face in the picture, determine the face identification contains second face image; according to the corresponding relation between face identification and second face image, according to the corresponding relationship between video clips belong to second face frame and second frame images of the face three, party identification, face second face images and video clips of the corresponding relation table. Thus, according to the corresponding relation between the determined video segment and the face marker, the user can push the video segment containing only the actor who has the desired view.

【技术实现步骤摘要】
视频识别方法和装置
本公开涉及图像处理
,尤其涉及一种视频识别方法和装置。
技术介绍
随着社会的快速发展,科学技术的不断进步,人们所能触及到的信息呈现几何式的增长,人们越来越需要借助信息搜索技术在海量的信息中挖掘出有效信息。目前的信息搜索技术对于文字的搜索效果较好,可以快速定位到包含有用户预设关键词的文章,但是对于一段视频而言,若用户希望观看仅包含自己喜爱演员出场的视频片断,则只能通过拖动视频进度按钮或按下视频快进键进行查找,费时费力,且定位不准确。
技术实现思路
为了解决现有技术中,对视频中演员出场时间段无法定位的问题,本公开提供一种视频识别方法和装置,通过对视频进行片断划分,并在划分后的视频片断中进行人脸识别,确定出视频片断与人脸身份的对应关系,从而可以为用户推送仅包含有其所希望观看的演员出场的视频片断,该方法有效且快速实现人脸识别,人脸视频片断定位,提升用户观赏视频的用户体验。本公开提供一种视频识别方法和装置,所述技术方案如下:根据本公开实施例的第一方面,提供一种视频识别方法,包括:获取目标视频;根据第一预设帧间隔,对所述目标视频进行划分,得到多个视频片断;根据第二预设帧间隔,从每个所述视频片断中提取出第一帧图像;检测所述第一帧图像中是否包含人脸信息,将包含有人脸信息的第一帧图像提取出来,得到第二人脸帧图像;基于预设识别模型,对所述第二人脸帧图像中的人脸身份进行识别,确定所述第二人脸帧图像中包含的人脸标识;根据所述人脸标识与所述第二人脸帧图像的对应关系,根据所述第二人脸帧图像与所述第二人脸帧图像所归属的视频片断的对应关系,形成所述人脸标识、所述第二人脸帧图像、所述视频片断的三方对应关系表。根据本公开实施例的第二方面,提供一种视频识别装置,包括:第一获取模块,用于获取目标视频;第一划分模块,用于根据第一预设帧间隔,对所述目标视频进行划分,得到多个视频片断;第二划分模块,用于根据第二预设帧间隔,从每个所述视频片断中提取出第一帧图像;检测模块,用于检测所述第一帧图像中是否包含人脸信息,将包含有人脸信息的第一帧图像提取出来,得到第二人脸帧图像;识别模块,用于基于预设识别模型,对所述第二人脸帧图像中的人脸身份进行识别,确定所述第二人脸帧图像中包含的人脸标识;匹配模块,用于根据所述人脸标识与所述第二人脸帧图像的对应关系,根据所述第二人脸帧图像与所述第二人脸帧图像所归属的视频片断的对应关系,形成所述人脸标识、所述第二人脸帧图像、所述视频片断的三方对应关系表。本公开的实施例提供的方法及装置可以包括以下有益效果:通过获取目标视频;根据第一预设帧间隔,对目标视频进行划分,得到多个视频片断;根据第二预设帧间隔,从每个视频片断中提取出第一帧图像;检测第一帧图像中是否包含人脸信息,将包含有人脸信息的第一帧图像提取出来,得到第二人脸帧图像;基于预设识别模型,对第二人脸帧图像中的人脸身份进行识别,确定第二人脸帧图像中包含的人脸标识;根据人脸标识与第二人脸帧图像的对应关系,根据第二人脸帧图像与第二人脸帧图像所归属的视频片断的对应关系,形成人脸标识、第二人脸帧图像、视频片断的三方对应关系表。从而可以根据确定出的视频片断与人脸标识的对应关系,为用户推送仅包含有其所希望观看的演员出场的视频片断,该方法有效且快速实现人脸识别,人脸视频片断定位,提升用户观赏视频的用户体验。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种视频识别方法的流程图;图2是根据另一示例性实施例示出的一种视频识别方法的流程图;图3是图2所示实施例的一种视频划分方式的示意图;图4是根据一示例性实施例示出的一种视频识别装置的流程图;图5是根据另一示例性实施例示出的一种视频识别装置的流程图。通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种视频识别方法的流程图,如图1所示,本实施例的视频识别方法可以应用于视频提供商的视频服务器中也可以应用于接收视频方的终端(客户端设备)中,以下以应用于视频服务器中来举例说明,本实施例的方法包括以下步骤:该视频处理方法包括以下步骤:在步骤101中,获取目标视频。具体的,视频本质上是由一系列的静态影像连接而成,通常来说连续的图像变化每秒超过24帧画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频。通过对构成目标视频的连续的帧图像进行人脸图像的识别,可以实现对目标视频中出现的演员的识别。在步骤102中,根据第一预设帧间隔,对目标视频进行划分,得到多个视频片断。具体的,如前所述,视频流之所以可以由一帧帧的静态画面构成,主要是因为人眼对于快速变化的单幅静态画面的识别能力有限,因此由静态画面组成的视频,人眼看上去可以是平滑连续的视觉效果。因此,可以根据一定间隔区间内包含的静态画面数量,将目标视频划分为一个个的视频片断,并且从用户观看视频的观感效果来说,第一预设帧间隔可以以分钟为单位,如0.5分钟、1分钟,这样当从目标视频中提取出包含有用户喜爱演员出场的视频片断时,每段视频的流动性较好,没有一帧帧画面的跳跃感与突兀感。在步骤103中,根据第二预设帧间隔,从每个视频片断中提取出第一帧图像。具体的,即使将完整视频进行分段处理后,每段视频片断内包含的帧图像的数量依旧很大,如前所述一秒钟的视频中可以包含有几十帧的静态图像,若对每个视频片断中的每帧图像都进行人脸识别操作,运算量巨大,识别速率不高。因此,可以在每个视频片断中抽取出一些特定的帧图像,对这些特定的帧图像进行扫描,得到图像中所包含的人脸特征信息,对特定帧图像的提取可以根据处理器的处理性能进行划分,若处理器的处理性能高,第二预设帧间隔可以较小,由于第一帧图像中可能包含有人脸信息,也可能未包含人脸信息,若第二预设帧间隔小则提高了从视频片断中提取到包含有人脸信息的帧图像的几率。优选的,第一预设帧间隔大于第二预设帧间隔。在步骤104中,检测第一帧图像中是否包含人脸信息,将包含有人脸信息的第一帧图像提取出来,得到第二人脸帧图像。具体的,检测第一帧图像中是否包含人脸信息是指在该图像中以一定的策略进行搜索,以确定其中是否含有人脸信息,其中的人脸信息可以是单张人脸信息或多张人脸信息,并在该帧图像中对人脸信息出现的位置进行标定,以确认各个人脸信息在帧图像中的坐标位置。对第一帧图像进行筛选,将包含有人脸信息的第一帧图像提取出来,得到第二人脸帧图像。在步骤105中,基于预设识别模型,对第二本文档来自技高网...
视频识别方法和装置

【技术保护点】
一种视频识别方法,其特征在于,所述方法包括:获取目标视频;根据第一预设帧间隔,对所述目标视频进行划分,得到多个视频片断;根据第二预设帧间隔,从每个所述视频片断中提取出第一帧图像;检测所述第一帧图像中是否包含人脸信息,将包含有人脸信息的第一帧图像提取出来,得到第二人脸帧图像;基于预设识别模型,对所述第二人脸帧图像中的人脸身份进行识别,确定所述第二人脸帧图像中包含的人脸标识;根据所述人脸标识与所述第二人脸帧图像的对应关系,根据所述第二人脸帧图像与所述第二人脸帧图像所归属的视频片断的对应关系,形成所述人脸标识、所述第二人脸帧图像、所述视频片断的三方对应关系表。

【技术特征摘要】
1.一种视频识别方法,其特征在于,所述方法包括:获取目标视频;根据第一预设帧间隔,对所述目标视频进行划分,得到多个视频片断;根据第二预设帧间隔,从每个所述视频片断中提取出第一帧图像;检测所述第一帧图像中是否包含人脸信息,将包含有人脸信息的第一帧图像提取出来,得到第二人脸帧图像;基于预设识别模型,对所述第二人脸帧图像中的人脸身份进行识别,确定所述第二人脸帧图像中包含的人脸标识;根据所述人脸标识与所述第二人脸帧图像的对应关系,根据所述第二人脸帧图像与所述第二人脸帧图像所归属的视频片断的对应关系,形成所述人脸标识、所述第二人脸帧图像、所述视频片断的三方对应关系表。2.根据权利要求1所述的方法,其特征在于,所述第一预设帧间隔大于所述第二预设帧间隔。3.根据权利要求1所述的方法,其特征在于,所述基于预设识别模型,对所述第二人脸帧图像中的人脸身份进行识别,确定所述第二人脸帧图像中包含的人脸标识之前,还包括:从所述目标视频的描述信息中获取与所述目标视频对应的目标人脸标识;相应的,所述基于预设识别模型,对所述第二人脸帧图像中的人脸身份进行识别,确定所述第二人脸帧图像中包含的人脸标识包括:根据所述目标人脸标识从识别模型数库中调取与所述目标人脸标识对应的第一预设识别模型,基于所述第一预设识别模型,对所述第二人脸帧图像中的人脸身份进行识别,在所述第二人脸帧图像中确定第三人脸帧图像,所述第三人脸帧图像为包含有所述目标人脸标识的第二人脸帧图像;相应的,所述根据所述人脸标识与所述第二人脸帧图像的对应关系,根据所述第二人脸帧图像与所述第二人脸帧图像所归属的视频片断的对应关系,形成所述人脸标识、所述第二人脸帧图像、所述视频片断的三方对应关系表包括:根据所述目标人脸标识与所述第三人脸帧图像的对应关系,根据所述第三人脸帧图像与所述第三人脸帧图像所归属的视频片断的对应关系,形成所述目标人脸标识、所述第三人脸帧图像、所述视频片断的三方对应关系表。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标人脸标识从识别模型数库中调取与所述目标人脸标识对应的第一预设识别模型之前,还包括:根据所述目标人脸标识,从图片数库中调取与所述目标人脸标识对应的目标人脸图片数据包;采用所述目标人脸图片数据包作为训练样本,训练得到与所述目标人脸标识对应的所述第一预设识别模型。5.根据权利要求1~4任一项所述的方法,其特征在于,所述形成所述人脸标识、所述第二人脸帧图像、所述视频片断的三方对应关系表之后,还包括:接收终端发送的视频推送请求...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1