视频监控系统图像获取方法及装置制造方法及图纸

技术编号:12300961 阅读:70 留言:0更新日期:2015-11-11 11:17
本申请提供一种视频监控系统图像获取方法,其包括:获取监控视频中的一个帧,即获得该帧表示的图像;按照预定噪声去除规则去除所述图像中的噪声数据;按照预定对象识别规则在所述去除噪声数据的图像中识别目标对象;为所述帧添加标签,所述标签能基于语义表达目标对象的预定特征;对应所述帧存储所述标签。本申请通过对提取的视觉底层特征,按照预定的算法映射到便于人直观理解的高层语义信息,并在此基础上实现对视频监控图像数据的分类和标注,较好的表达视频监控图像数据的语义,减小甚至消除图像底层特征与人类丰富语义内容之间的“语义鸿沟”,实现视频监控图像的快速、高效的获取。

【技术实现步骤摘要】

本专利技术属于多媒体
,尤其涉及一种视频监控系统图像获取方法及装置
技术介绍
与文本信息相比,图像、视频包含的信息丰富,其以直观、生动和实时等优点而广 泛应用于各行各业。 对于大范围区域的视频监控,理论上可以使用大量摄像机将监控区域全面覆盖, 这些摄像机在视域上互相重叠或者相邻。这种摄像机布置方式的监控系统成本较高;而且 也没有必要,因为并非所有的区域都需要监控。因此,在实际监控系统中,为了降低成本,通 常在重要区域布置摄像机,每个摄像机仅覆盖一块需要监控的区域。虽然这些摄像机视域 间会留下监控盲区,但每个摄像机并不孤立,目标会通过盲区在不同摄像机视域间转移。这 样,通过合理的配置,少量摄像机就可构成一个能覆盖大片区域的监控系统,称之为无重叠 视域多摄像机(Non-OverlappingMulti-Camera)监控系统。 无重叠视域多摄像机监控系统是安全防范系统的主要组成部分,是一种防范能力 较强的综合系统。随着经济社会的发展,人们对安全监控的需求层次提高,因此在各种重要 场合安装大量的摄像机,形成的无重叠视域多摄像机监控系统每一时刻都会产生大量的图 像、视频数据,图像、视频数据给人们的工作生活带来极大便利的同时,也使得从大量图像、 视频数据中快速准确地寻找感兴趣的目标对象变得十分困难。
技术实现思路
为了克服现有技术难以快速准确的从大量的图像、视频数据中寻找感兴趣的目标 对象,本专利技术一方面提供了一种视频监控系统图像获取方法。技术方案如下: -种视频监控系统图像获取方法,其包括: 获取监控视频中的一个帧,即获得该帧表示的图像; 按照预定噪声去除规则去除所述图像中的噪声数据; 按照预定对象识别规则在所述去除噪声数据的图像中识别目标对象; 为所述帧添加标签,所述标签能基于语义表达目标对象的预定特征; 对应所述帧存储所述标签。 对应地,本专利技术另一方面提供了一种视频监控系统图像获取装置,其包括: 获取单元,所述获取单元用于获取监控视频的一个帧,即获得该帧表示的图像; 去噪单元,所述去噪单元用于按照预定噪声去除规则去除所述图像中的噪声数 据; 识别单元,所述识别单元用于按照预定对象识别规则在所述去除噪声数据的图像 中识别目标对象; 添加单元,所述添加单元用于为所述帧添加标签,所述标签能基于语义表达目标 对象的预定特征; 存储单元,所述存储单元用于存储所述帧对应的标签。 借由以上的技术方案,本专利技术的有益效果在于:本申请通过对提取的视觉底层特 征,按照预定的算法映射到便于人直观理解的高层语义信息,并在此基础上实现对视频监 控图像数据的分类和标注,较好的表达视频监控图像数据的语义,减小甚至消除图像底层 特征与人类丰富语义内容之间的"语义鸿沟",实现视频监控图像的快速、高效的获取。【附图说明】 为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。 图1为本专利技术一实施例方法的流程示意图; 图2为一视频监控图像的示意图; 图3为本专利技术另一实施例方法的流程示意图; 图4为本专利技术一实施场景的示意图;图5为本专利技术一实施例装置的模块结构示意图;图6为本专利技术另一实施例装置的模块结构示意图。【具体实施方式】 下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于 本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本专利技术保护的范围。 在过去的三十几年时间里,基于内容的图像检索(ContentBasedImage Retrieval,CBIR)成为研究热点,其目的是找到一种高效的方法,可以在大容量的图像数据 库中,自动完成图像的检索过程,并且能够最大限度的减小图像底层视觉特征与人类丰富 语义内容之间的"语义鸿沟"。当前大量的基于内容的图像检索思想都是使用颜色、纹理、形状及区域等视觉底 层特征来获得图像内容信息,衡量图像之间的相似程度以实现基于内容的检索。然而,这些 所谓的图像内容信息反映的只是图像的一些客观统计特性,并不能真正被人类视觉理解, 人们判断图像的相似性并非建立在图像的颜色、形状的相似性上,而是主要根据图像的含 义来判断图像是否符合自己的需要,这些图像含义即是图像的高层语义知识。 此外,现有技术中基于颜色、纹理、形状及区域等视觉底层特征获得图像内容信息 不具有时空连续性。例如:基于颜色特征的检索方法抽取的特征向量是颜色直方图,虽然能 够较好地反映图像中各种颜色的频率分布,但实际监控系统的多个摄像机采集的监控图像 中,与目标对象的颜色相同或相似的对象较多,从而导致检索得到的并不是想要的;且由于 环境光照强度、拍摄角度、成像特性、对象远近等差异,不同摄像机采集到的同一对象的颜 色也会有差异。 所以,理想的图像检索模式应该是基于图像高层语义特征的检索。例如,用户需 要查找"骑电动车、戴头盔的人",这就要求系统能够自动识别"电动车"和"头盔"等语义信 息。然而,目前的计算机视觉和图像理解技术还不能自动提取图像的语义特征,只能借助图 像的外观轮廓和基于专业监控人员个人知识水平的辨别。但是,这种查找方式费时费力, 且效率低下。实验表明,一名专业监控人员在同时查看两台视频监控器的情况下,22min之 后将会错过95%的应监视目标。此外,西方有句谤语,"apictureisworthathousand words",一幅图像本身包含的语义信息非常丰富,不同的人对同一幅图像的语义理解不尽 相同,给出的查询结果是基于不同的人的主观认识,自然也就千差万别。 解决这一问题的方法是寻求有效地、具有一定语义意义的特征描述方法,并且该 方法可以将视觉底层特征映射到便于人直观理解的高层语义。 CBIR的本质是在提取视频监控图像的视觉底层特征的基础上,从图像库中找出与 查询图像相关或相似的对象。这实质上蕴含着一个前提:即语义相关的对象具有相似的视 觉底层特征。这就使得对视频监控图像进行语义信息分类、加注分类标签成为可能。 本申请基于上述理论,通过实现基于内容的图像分类、加注分类标签来提取便于 人直观理解的高层语义信息。具体地,本申请提供的一种实施方式的流程图如图1所示。 该实施例可以包括: S10 :获取监控视频中的一个帧,即获得该帧表示的图像。 本实施方式获取监控视频的是单帧图像。获取的方式可以是通过单兵装备摄像 当前第1页1 2 3 4 本文档来自技高网...

【技术保护点】
一种视频监控系统图像获取方法,其特征在于,其包括:获取监控视频中的一个帧,即获得该帧表示的图像;按照预定噪声去除规则去除所述图像中的噪声数据;按照预定对象识别规则在所述去除噪声数据的图像中识别目标对象;为所述帧添加标签,所述标签能基于语义表达目标对象的预定特征;对应所述帧存储所述标签。

【技术特征摘要】

【专利技术属性】
技术研发人员:冯文刚
申请(专利权)人:中国人民公安大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1