视频检索方法及装置、计算机设备和介质制造方法及图纸

技术编号:29330735 阅读:10 留言:0更新日期:2021-07-20 17:48
本公开提供了一种视频检索方法及装置、计算设备和介质,涉及人工智能领域,尤其涉及智能搜索领域。实现方案为:基于预设规则,从待检索视频中提取第一转场帧序列;获取多个候选视频中每一个候选视频所对应的第二转场帧序列,其中,每一个候选视频的第二转场帧序列基于该预设规则从该候选视频中提取得到;以及基于第一转场帧序列,以及多个候选视频中每一个候选视频所对应的第二转场帧序列,确定多个候选视频中与待检索视频相匹配的视频。

【技术实现步骤摘要】
视频检索方法及装置、计算机设备和介质
本公开涉及人工智能
,尤其涉及智能检索,具体涉及一种视频检索的方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
技术介绍
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。如今,人工智能已经被越来越广泛地应用于各个领域之中,例如,智能检索领域。在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
技术实现思路
本公开提供了一种视频检索的方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。根据本公开的一方面,提供了一种视频检索方法,包括:基于预设规则,从待检索视频中提取第一转场帧序列;获取多个候选视频中每一个候选视频所对应的第二转场帧序列,其中,每一个候选视频的第二转场帧序列基于预设规则从该候选视频中提取得到;以及基于第一转场帧序列,以及多个候选视频中每一个候选视频所对应的第二转场帧序列,确定多个候选视频中与待检索视频相匹配的视频。根据本公开的一方面,提供了一种视频检索装置,包括:提取单元,被配置用于基于预设规则,从待检索视频中提取第一转场帧序列;获取单元,被配置用于获取多个候选视频中每一个候选视频所对应的第二转场帧序列,其中,每一个候选视频的第二转场帧序列基于预设规则从该候选视频中提取得到;以及确定单元,被配置用于基于第一转场帧序列,以及多个候选视频中每一个候选视频所对应的第二转场帧序列,确定多个候选视频中与待检索视频相匹配的视频。根据本公开的另一方面,提供了一种计算机设备,包括:存储器、处理器以及存储在存储器上的计算机程序,其中,处理器被配置为执行计算机程序以实现上述方法的步骤。根据本公开的另一方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现上述的方法的步骤。根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序被处理器执行时实现上述的方法的步骤。根据本公开的一个或多个实施例,可以基于从待检索视频和每个候选视频中分别提取的转场帧序列执行视频之间的匹配,由此有效地减少了在视频检索的过程中所需处理的数据量,节省计算资源,提升了视频检索效率。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;图2示出了根据本公开的实施例的视频检索方法的流程图;图3示出了根据本公开的实施例的待检索视频与候选视频的匹配类型示意图;图4示出了根据本公开的实施例的视频检索装置的结构框图;图5示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。具体实施方式以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。在本公开中对各种示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。随着高速、稳定的数据网络的建立,用户已经可以随时随地查看高质量的视频。然而,当前的视频检索的技术尚不完善。在相关技术中,对视频的检索一般采用“文字搜视频”的方式,即用户输入检索词后,在数据库中查找与该检索词相匹配的相应标签,并进而将具有相应标签的视频作为检索结果推送给用户。而对于“视频搜视频”的视频检索方式还缺乏有效的解决方案。究其原因是由于视频中所包含的数据量巨大,视频与视频之间的比对需要耗费大量计算资源,难以实现。基于此,本公开提出一种能够实现“视频搜视频”的视频检索方法,以使用户能够根据所输入的待检索视频,从海量的候选视频中检索出与待检索视频相匹配的视频,具体地,通过采用统一的预设规则,从待检索视频和多个候选视频中每一个候选视频中分别提取转场帧序列,并基于待检索视频的转场帧序列,以及多个候选视频中每一个候选视频的转场帧序列,确定多个候选视频中与待检索视频相匹配的视频。由此,能够基于所提取的转场帧序列,有效地减少视频检索的过程中所需处理的数据量,节省计算资源,提升检索效率,使“视频搜视频”的视频检索方式得以实现。下面将结合附图详细描述本公开的实施例。图1示出了根据本公开的实施例可以将本文描述的各种方法和装置在其中实施的示例性系统100的示意图。参考图1,该系统100包括一个或多个客户端设备101、102、103、104、105和106、服务器120以及将一个或多个客户端设备耦接到服务器120的一个或多个通信网络110。客户端设备101、102、103、104、105和106可以被配置为执行一个或多个应用程序。在本公开的实施例中,服务器120可以运行使得能够执行视频检索的方法的一个或多个服务或软件应用。在某些实施例中,服务器120还可以提供可以包括非虚拟环境和虚拟环境的其他服务或软件应用。在某些实施例中,这些服务可以作为基于web的服务或云服务提供,例如在软件即服务(SaaS)模型下提供给客户端设备101、102、103、104、105和/或106的用户。在图1所示的配置中,服务器120可以包括实现由服务器120执行的功能的一个或多个组件。这些组件可以包括可由一个或多个处理器执行的软件组件、硬件组件或其组合。操作客户端设备101、102、103、104、105和/或106的用户可本文档来自技高网...

【技术保护点】
1.一种视频检索方法,包括:/n基于预设规则,从待检索视频中提取第一转场帧序列;/n获取多个候选视频中每一个候选视频所对应的第二转场帧序列,其中,每一个候选视频的第二转场帧序列基于所述预设规则从该候选视频中提取得到;以及/n基于所述第一转场帧序列,以及所述多个候选视频中每一个候选视频所对应的第二转场帧序列,确定所述多个候选视频中与所述待检索视频相匹配的视频。/n

【技术特征摘要】
1.一种视频检索方法,包括:
基于预设规则,从待检索视频中提取第一转场帧序列;
获取多个候选视频中每一个候选视频所对应的第二转场帧序列,其中,每一个候选视频的第二转场帧序列基于所述预设规则从该候选视频中提取得到;以及
基于所述第一转场帧序列,以及所述多个候选视频中每一个候选视频所对应的第二转场帧序列,确定所述多个候选视频中与所述待检索视频相匹配的视频。


2.根据权利要求1所述的方法,其中,所述基于预设规则,从待检索视频中提取第一转场帧序列包括:
针对所述待检索视频中任意两个相邻帧,
确定以该两个相邻帧中前一帧结束的在先帧序列,以及以该两个相邻帧中后一帧开始的在后帧序列;以及
响应于所述在先帧序列与所述在后帧序列满足预设条件,确定该两个相邻帧中至少一个为第一转场帧;以及
基于所确定的每一个第一转场帧,确定所述待检索视频中的第一转场帧序列。


3.根据权利要求2所述的方法,其中,所述响应于所述在先帧序列与所述在后帧序列满足预设条件,确定该两个相邻帧中至少一个为第一转场帧包括:
识别所述在先帧序列所对应的第一场景信息,以及所述在后帧序列所对应的第二场景信息;以及
响应于所述第一场景信息与所述第二场景信息之间的差异超出预设范围,确定该两个相邻帧中至少一个为第一转场帧。


4.根据权利要求3所述的方法,其中,所述第一场景信息和所述第二场景信息分别包括以下至少一种:
背景信息;
预设目标物信息;或
运动物体信息。


5.根据权利要求2所述的方法,其中,所述响应于所述在先帧序列与所述在后帧序列满足预设条件,确定该两个相邻帧中至少一个为第一转场帧包括:
确定所述在先帧序列与所述在后帧序列之间的相似度值;以及
响应于所述在先帧序列与所述在后帧序列之间的相似度值小于预设相似度阈值,确定该两个相邻帧中至少一个为第一转场帧。


6.根据权利要求5所述的方法,其中,所述确定所述在先帧序列与所述在后帧序列之间的相似度值包括:
确定所述在先帧序列所对应的第一特征向量,以及所述在后帧序列所对应的第二特征向量;
将所述第一特征向量和所述第二特征向量分别输入训练完成的匹配模型;以及
获取所述匹配模型所输出的针对所述在先帧序列与所述在后帧序列的相似度值。


7.根据权利要求1所述的方法,其中,所述基于所述第一转场帧序列,以及所述多个候选视频中每一个候选视频所对应的第二转场帧序列,确定所述多个候选视频中与所述待检索视频相匹配的视频包括:
针对所述多个候选视频中每一个候选视频,响应于该候选视频所对应的第二转场帧序列与所述第一转场帧序列满足预设匹配条件,确定该候选视频为与所述待检索视频相匹配的视频。


8.根据权利要求7所述的方法,其中,所述该候选视频所对应的第二转场帧序列与所述第一转场帧序列满足预设匹配条件包括:
针对所述第二转场帧序列中预设长度的第二子序列,所述第一转场帧序列中存在与所述第二子序列相应的所述预设长度的第一子序列,其中,所述第二子序列与所述第一子序列之间依次对应的每两帧之间的相似度大于预设阈值。


9.根据权利要求1所述的方法,还包括:
针对所述多个候选视频中每一个候选视频,基于所述预设规则,预先从该候选视频中提取该候选视频所对应的第二转场帧序列。


10.根据权利...

【专利技术属性】
技术研发人员:刘俊启
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1