一种视频目标检索方法技术

技术编号:18050140 阅读:40 留言:0更新日期:2018-05-26 08:08
一种视频目标检索方法,首先对实时视频流/本地视频文件进行硬解码、图像转换以获取视频流,在将解码后的图像数据输入至SSD算法模型,获得图像中的各类目标位置框信息,在将目标位置框信息输入基于卡尔曼滤波的目标跟踪算法对目标进行区分与跟踪,并对每个跟踪目标分别进行截图,并提取目标图片的RGB颜色直方图特征、面积特征、目标类别存入数据库中,同时在数据库中建立主键对每个目标进行标识;输入待检索目标,首先对数据库进行筛选,然后提取颜色、面积特征,基于欧几里德距离计算与数据库数据的相似度,按照相似度由高到低排序,得目标检索结果,自动快速检索出符合要求的目标,速度快、效率高,可广泛应用于实战中。

【技术实现步骤摘要】
一种视频目标检索方法
本专利技术涉及视频检索
,尤其涉及一种视频目标检索方法。
技术介绍
目前,视频监控系统在维护社会治安、加强社会管理及安全保障方面发挥重要作用,面对日益增长的摄像头数量,从这些海量的视频监控中寻找感兴趣的目标将耗费大量人力物力。因此视频目标自动检测、存储及检索,能够有效提高海量视频监控效率。然而现有的视频目标检索系统在对运动目标进行提取、存储的过程中,只对运动目标进行截取,并未对目标按照类别划分进行标识,目标特征选取单一,面对从大量的视频数据中检索出特定类别目标时,局限性较大,不能有效保障检索的效率。
技术实现思路
本专利技术所解决的技术问题在于提供一种视频目标检索方法,以解决上述
技术介绍
中的缺点。本专利技术所解决的技术问题采用以下技术方案来实现:一种视频目标检索方法,具体步骤如下:1)对实时视频流/本地视频文件进行硬解码、图像转换,以获取视频流,得到可进行计算的图像数据;2)在ubuntu系统下配置caffe环境,对caffe中SSD算法模型的C++实现进行重新编译;3)将步骤1)中解码后的图像数据输入至SSD算法模型中,以获得图像中的各类目标位置框信息,在根据检索需求从中选取主要检索目标,获取目标在图像中的位置框信息;4)将步骤3)中获取的目标位置框信息输入至基于卡尔曼滤波的目标跟踪算法中,使得ubuntu系统能够在当前场景下对目标进行区分与跟踪;5)对步骤4)中每个跟踪目标分别进行截图,按照时间分段截取多张目标图片,并提取目标图片的RGB颜色直方图特征、面积特征、目标类别,存入数据库中,并在数据库中建立主键对每个目标进行标识;6)输入待检索目标,首先按照目标类别对步骤5)中建立的数据库进行筛选,然后提取待检索目标的颜色、面积特征,基于欧几里德距离计算与数据库数据的相似度,得到与待检索目标的相似度;7)按照相似度由高到低排序,得目标检索结果。在本专利技术中,步骤1)中,利用ffmpeg或cuda工具对实时视频流/本地视频文件进行硬解码、图像转换,以获取视频流,得到可进行计算的图像数据。在本专利技术中,步骤1)中,利用OpenCV的函数读取视频流及本地视频文件。在本专利技术中,步骤5)中,按照时间分段截取5张目标图片,5张目标图片都是对同一目标不同时间段的描述。在本专利技术中,步骤5)中,对存入数据库中目标图片的RGB颜色直方图特征、面积特征,按照0.4~0.8:0.1~0.2的权重比进行分配。有益效果:本专利技术采用基于多特征融合的视频目标检索,将多目标识别、多目标跟踪及目标特征提取进行并行有效集成,有效提高识别效率,同时将目标类别信息进行存储,针对用户对特定类别目标检索的需求,自动快速检索出符合要求的目标,速度快、效率高,可广泛应用于实战中,具有一定的经济效益和使用价值。附图说明图1为本专利技术的较佳实施例的流程示意图。具体实施方式为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本专利技术。参见图1的一种视频目标检索方法,具体步骤如下:1)利用ffmpeg工具、cuda工具对实时视频流/本地视频文件进行硬解码、图像转换,以获取视频流,得到可进行计算的图像数据,也可利用OpenCV的函数进行视频流及本地视频文件读取;2)在ubuntu系统下配置caffe环境,对caffe中SSD算法模型的C++实现进行重新编译;3)将步骤1)中解码后的图像数据输入至SSD算法模型中,以获得图像中的各类目标位置框信息(其中目标类别包括:人、自行车、小车、大巴车、摩托车、猫、狗等,目标种类可通过重新训练算法进行更改),在根据检索需求从中选取主要检索目标,获取其位置框信息(目标在图像中的位置);4)将步骤3)中获取的目标位置框信息输入至基于卡尔曼滤波的目标跟踪算法中,使得ubuntu系统能够在当前场景下对目标进行区分与跟踪;5)对步骤4)中每个跟踪目标分别进行截图,按照时间分段截取5张目标图片(5张目标图片都是对同一目标不同时间段的描述),并提取RGB颜色直方图特征、目标图片的面积特征、目标的类别,存入数据库中(对于颜色及面积特征,按照一定权重比进行分配,权重根据实际应用场景进行调整(例如0.8:0.2)),并在数据库中建立主键对每个目标进行标识;6)输入待检索目标,首先按照目标类别对步骤5)中建立的数据库进行筛选,然后提取待检索目标的颜色、面积特征,基于欧几里德距离计算与数据库数据的相似度(对颜色特征与面积特征计算结果首先进行标准化处理,使得量纲统一,然后分别乘上步骤5)中的对应权重,再相加),得到与待检索目标的相似度;7)按照相似度由高到低排序,得目标检索结果。在本实施例中,系统环境需求:显卡GTX1080;系统:ubuntu;软件:cuda、ffmpeg、caffe、OpenCV。以上显示和描述了本专利技术的基本原理和主要特征和本专利技术的优点。本行业的技术人员应该了解,本专利技术不受上述实施例的限制,上述实施例和说明书中描述的只是说明本专利技术的原理,在不脱离本专利技术精神和范围的前提下,本专利技术还会有各种变化和改进,这些变化和改进都落入要求保护的本专利技术范围内。本专利技术要求保护范围由所附的权利要求书及其等效物界定。本文档来自技高网...
一种视频目标检索方法

【技术保护点】
一种视频目标检索方法,其特征在于,具体步骤如下:1)对实时视频流/本地视频文件进行硬解码、图像转换,以获取视频流,得到可进行计算的图像数据;2)在ubuntu系统下配置caffe环境,对caffe中SSD算法模型的C++实现进行重新编译;3)将步骤1)中解码后的图像数据输入至SSD算法模型中,以获得图像中的各类目标位置框信息,在根据检索需求从中选取主要检索目标,获取目标在图像中的位置框信息;4)将步骤3)中获取的目标位置框信息输入至基于卡尔曼滤波的目标跟踪算法中,使得ubuntu系统能够在当前场景下对目标进行区分与跟踪;5)对步骤4)中每个跟踪目标分别进行截图,按照时间分段截取多张目标图片,并提取目标图片的RGB颜色直方图特征、面积特征、目标类别,存入数据库中,并在数据库中建立主键对每个目标进行标识;6)输入待检索目标,首先按照目标类别对步骤5)中建立的数据库进行筛选,然后提取待检索目标的颜色、面积特征,基于欧几里德距离计算与数据库数据的相似度,得到与待检索目标的相似度;7)按照相似度由高到低排序,得目标检索结果。

【技术特征摘要】
1.一种视频目标检索方法,其特征在于,具体步骤如下:1)对实时视频流/本地视频文件进行硬解码、图像转换,以获取视频流,得到可进行计算的图像数据;2)在ubuntu系统下配置caffe环境,对caffe中SSD算法模型的C++实现进行重新编译;3)将步骤1)中解码后的图像数据输入至SSD算法模型中,以获得图像中的各类目标位置框信息,在根据检索需求从中选取主要检索目标,获取目标在图像中的位置框信息;4)将步骤3)中获取的目标位置框信息输入至基于卡尔曼滤波的目标跟踪算法中,使得ubuntu系统能够在当前场景下对目标进行区分与跟踪;5)对步骤4)中每个跟踪目标分别进行截图,按照时间分段截取多张目标图片,并提取目标图片的RGB颜色直方图特征、面积特征、目标类别,存入数据库中,并在数据库中建立主键对每个目标进行标识;6)输入待检索目标,首先按照目标类别对步骤5)中建立的数据库进行筛...

【专利技术属性】
技术研发人员:贠周会吴斌谢吉朋
申请(专利权)人:江西洪都航空工业集团有限责任公司
类型:发明
国别省市:江西,36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1