基于视频的目标搜索方法、装置、设备、存储介质制造方法及图纸

技术编号:23239498 阅读:11 留言:0更新日期:2020-02-04 18:43
本公开提供了一种基于视频的目标搜索方法、装置、设备、存储介质。基于视频的目标搜索方法,包括:抽取所述视频中的帧;检测所述视频中的帧中是否存在预设目标,若存在则利用边界框确定所述预设目标在所述视频中的帧中的位置;抽取所述边界框确定的所述预设目标的特征;通过所述预设目标的特征搜索所述预设目标对应的待推荐信息;其中,所述边界框为包裹住所述预设目标的最小边框。本公开可以实现确定视频中的同一目标以避免重复搜索并能确定最优目标,提升了用户的使用体验。

Video based object search methods, devices, devices and storage media

【技术实现步骤摘要】
基于视频的目标搜索方法、装置、设备、存储介质
本公开涉及计算机软件
,尤其涉及一种基于视频的目标搜索方法、装置、设备、存储介质。
技术介绍
随着多媒体技术的发展,人们越来越离不开各类智能设备。智能设备包括各式各样的设备与终端,包括利用计算机技术和数字通讯网技术来处理和控制信息的系统终端等。目前,带有触摸屏的智能设备如手机等得到了广泛应用。在一些具有触摸屏的智能设备上,人们经常会利用到计算机视觉技术,例如各种电商中的图像识别技术,比如淘宝的拍立淘、京东的拍照购等,但随着短视频或视频直播等产业的发展,用户希望在观看短视频或视频直播时对视频中的内容进行检测识别,以为用户进行个性化推荐,提高用户体验。目前主要存在如下问题:传统的识别搜索都是基于图像的,图像相对于视频要简单的多,且一般都是用户主动配合,而基于视频的识别搜索技术难度非常大。
技术实现思路
本公开正是为了解决上述课题而完成,其目的在于提供一种简单高效的,可实现确定视频中的同一目标以避免重复搜索并能确定最优目标的基于视频的目标搜索方法、装置、设备、存储介质。本公开提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。为了解决上述技术问题,本公开实施例提供一种基于视频的目标搜索方法,采用了如下所述的技术方案:抽取所述视频中的帧;检测所述视频中的帧中是否存在预设目标,若存在则利用边界框确定所述预设目标在所述视频中的帧中的位置;抽取所述边界框确定的所述预设目标的特征;通过所述预设目标的特征搜索所述预设目标对应的待推荐信息;其中,所述边界框为包裹住所述预设目标的最小边框。为了解决上述技术问题,本公开实施例还提供一种基于视频的目标搜索装置,采用了如下所述的技术方案,包括:视频抽帧装置,抽取所述视频中的帧;目标检测装置,检测所述视频中的帧中是否存在预设目标,若存在则利用边界框确定所述预设目标在所述视频中的帧中的位置;特征抽取装置,抽取所述边界框确定的所述预设目标的特征;搜索装置,通过所述预设目标的特征搜索所述预设目标对应的待推荐信息;其中,所述边界框为包裹住所述预设目标的最小边框。为了解决上述技术问题,本公开实施例还提供一种计算机设备,采用了如下所述的技术方案:包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如前述所述的基于视频的目标搜索方法。为了解决上述技术问题,本公开实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述所述的基于视频的目标搜索方法。根据本公开所公开的技术方案,与现有技术相比,本公开可以实现确定视频中的同一目标以避免重复搜索并能确定最优目标,提升了用户的使用体验。附图说明图1是本公开可以应用于其中的示例性系统架构图;图2是根据本公开的基于视频的目标搜索方法的一个实施例的流程图;图3是根据本公开的基于视频的目标搜索方法的边界框的示意图;图4是根据本公开的基于视频的目标搜索方法的一个实施例的抽取的帧画面的示意图;图5是根据本公开的基于视频的目标搜索装置的一个实施例的示意图;图6是根据本公开的计算机设备的一个实施例的结构示意图。结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。具体实施方式除非另有定义,本文所使用的所有的技术和科学术语与属于本公开的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本公开;本公开的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本公开的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本公开的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。为了使本
的人员更好地理解本公开方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。[系统结构]首先,说明本公开的一个实施例的系统的结构。如图1所示,系统结构100可以包括终端设备101、102、103、104,网络105和服务器106。网络105用以在终端设备101、102、103、104和服务器106之间提供通信链路的介质。在本实施例中,基于视频的目标搜索方法运行于其上的电子设备(例如图1所示的终端设备101、102、103或104)可以通过网络105进行各种信息的传输。网络105可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。需要指出的是,上述无线连接方式可以包括但不限于3G/4G/5G连接、Wi-Fi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB连接、以及其他现在已知或将来开发的无线连接方式。用户可以使用终端设备101、102、103、104通过网络105与服务器106交互,以接收或发送消息等。终端设备101、102、103或104上可以安装有各种客户端应用,例如视频直播与播放类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。终端设备101、102、103或104可以是具有触摸显示屏和/或支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(动态影像专家压缩标准音频层面3)、MP4(动态影像专家压缩标准音频层面4)播放器、头戴式显示设备、膝上型便携计算机和台式计算机等等。服务器106可以是提供各种服务的服务器,例如对终端设备101、102、103或104上显示的页面提供支持的后台服务器。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。这里,终端设备可以独立或通过与其他电子终端设备配合运行安卓系统中的应用实现本公开的实施例方法,也可以运行其他操作系统中的应用例如iOS系统、Windows系统、鸿蒙系统等的应用实现本公开的实施例方法。[基于视频的目标搜索方法]参考图2,示出了根据本公开的基于视频的目标搜索方法的一个实施例的流程图。所述基于视频的目标搜索方法,包括以下本文档来自技高网
...

【技术保护点】
1.一种基于视频的目标搜索方法,其特征在于,包括:/n抽取所述视频中的帧;/n检测所述视频中的帧中是否存在预设目标,若存在则利用边界框确定所述预设目标在所述视频中的帧中的位置;/n抽取所述边界框确定的所述预设目标的特征;/n通过所述预设目标的特征搜索所述预设目标对应的待推荐信息;/n其中,所述边界框为包裹住所述预设目标的最小边框。/n

【技术特征摘要】
1.一种基于视频的目标搜索方法,其特征在于,包括:
抽取所述视频中的帧;
检测所述视频中的帧中是否存在预设目标,若存在则利用边界框确定所述预设目标在所述视频中的帧中的位置;
抽取所述边界框确定的所述预设目标的特征;
通过所述预设目标的特征搜索所述预设目标对应的待推荐信息;
其中,所述边界框为包裹住所述预设目标的最小边框。


2.如权利要求1所述的基于视频的目标搜索方法,其特征在于,
抽取所述视频中的帧的方式为按照帧率抽取,所述帧率至少为24fps。


3.如权利要求1所述的基于视频的目标搜索方法,其特征在于,
所述预设目标为人体,抽取所述人体的边界框确定的所述视频中的帧中的人体的特征,包括所述人体的性别和姿态。


4.如权利要求3所述的基于视频的目标搜索方法,其特征在于,
所述预设目标还包括服饰,所述方法还包括:判断所述服饰的边界框是否在所述人体的边界框中,若在,则将所述人体的性别和姿态设定于所述服饰。


5.如权利要求4所述的基于视频的目标搜索方法,其特征在于,还包括,抽取所述服饰的边界框确定的所述服饰的款式特征。


6.如权利要求4所述的基于视频的目标搜索方法,其特征在于,
判断所述服饰的边界框在所述人体的边界框中的方法为,所述服饰的边界框与所述人体的边界框的重合面积与所述服饰的边界框的面积的比值大于第一阈值。


7.如权利要求1所述的基于视频的目标搜索方法,其特征在于,还包括,依次判断每组相邻的前后帧中的所述预设目标是否为同一目标,若所述每组相邻的前后帧中的所述预设目标均为同一目标则所述视频中的所述预设目标为同一目标,判断一组所述相邻的前后帧中的所述预设目标是否为同一目标的方法为,若前后帧中的所述预设目标的两个边界框的重合面积与两个边界框的总面积的比值大于第二阈值且所述预设目标的特征的欧式距离小于第三阈值,则相邻的前后帧中的所述预设目标为同一目标。


8.如权利要求1所述的基于视频的目标搜索方法,其特征在于,抽取所述边界...

【专利技术属性】
技术研发人员:周鸣王长虎
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1