一种图像主要目标的定位与识别方法技术

技术编号:10106696 阅读:171 留言:0更新日期:2014-06-01 21:31
本发明专利技术涉及一种图像主要目标定位与识别方法,属于数字图像处理领域。其具体操作步骤为:①从待识别图像中识别单体目标;②从待识别图像中识别关系目标;③确定候选主要目标区域;④从候选主要目标区域中确定主要目标。本发明专利技术提出的一种图像主要目标定位与识别方法,可以在待识别图像中快速识别图像主要目标,该方法适用于计算机快速自动发现、定位冗长视频中包含犯罪活动或犯罪分子的关键帧。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种图像主要目标定位与识别方法,属于数字图像处理领域。其具体操作步骤为:①从待识别图像中识别单体目标;②从待识别图像中识别关系目标;③确定候选主要目标区域;④从候选主要目标区域中确定主要目标。本专利技术提出的一种图像主要目标定位与识别方法,可以在待识别图像中快速识别图像主要目标,该方法适用于计算机快速自动发现、定位冗长视频中包含犯罪活动或犯罪分子的关键帧。【专利说明】
本专利技术涉及一种图像主要目标定位与识别方法,属于数字图像处理领域。
技术介绍
随着人工智能技术的不断发展,如何实现计算机自主认识周围环境、模仿人类自主理解周围世界,已成为当前以及今后很长一段时间计算机、人工智能技术的主要研究目标。实现计算机自主认识周围环境、自主理解周围世界的关键环节一实现图像主要目标定位与识别。图像主要目标是指处于原始图像中央区域内,处于较浅深度的目标。图像主要目标定位与识别技术是目前图像处理研究领域的一个热点、难点,其具有很宽广的应用前景。例如:在反恐维安等警方调查活动中,实现计算机自动发现、定位犯罪份子等。随着监控视频探头的普及与应用,越来越成为辅助警方分析犯罪活动,抓捕罪犯的有力帮手。由于监控视频拍摄的视频图像一般都几个小时,甚至几天的时长,而犯罪活动一般只有短短的几分钟。想要从冗长的视频录像中发现、定位犯罪活动的时间,分析犯罪过程,目前只能完全依靠警员长时间的观看视频录像来确定。这不仅耗费了大量的人力,而且花费时间也比较长,降低了第一时间抓捕罪犯的机率。目前,图像主要目标定位与识别研究仍处于初期阶段。大部分的研究工作仍处于单个目标的识别与定位,并不能有效的确认图像中的主要目标。美国伊利诺伊州大学香槟分校的Pedro F.Felzenszwalb博士和他的团队开创性的提出了轮廓模型(Deformable Part Model)较好的实现了图像中各种目标的定位与识另O。开启了图像目标识别研究领域的新时代,但是轮廓模型并不能分析、定位图像的主要目标。美国普林斯顿大学的L1.L.J博士和Fe1-Fe1.L博士的研究团队长期致力于图像分割与目标识别的研究工作,在数字图像的场景识别与目标定位研究中取得了很好的效果。他们通过构建联合概率模型,实现了计算机自动定位与识别图像中的各种目标,实现各种目标的简单文字标注,但是没能找出图像的主要目标。美国卡内基.梅隆大学的A.Gupta教授领导的研究团队和美国伊利诺伊州大学香槟分校的Ali Farhadi博士的研究团队以概率模型为基础,进行了大量关于图像目标定位与识别的研究。A.Gupta教授领导的研究团队提出一种基于贝叶斯方法的概率模型,通过计算各种类型的图像中不同目标出现的概率,来提高图像中的各种目标定位与识别的准确性。Ali Farhadi博士的研究团队通过采用改进的轮廓模型,提高图像中各种目标的定位与识别的准确性。而且他们还开创性的提出了图像语言短语(Visual Phrases)来发现图像中的各种目标之间的特定关系,并通过统计的方法试图找出图像中的主要目标。因此,需要设计一种更符合人类认知过程的、更加高效的计算机图像识别方法,实现计算机快速自动发现、定位冗长视频中包含犯罪活动或犯罪分子的关键帧。
技术实现思路
本专利技术的目的是为了提供,实现计算机快速自动发现、定位冗长视频中包含犯罪活动或犯罪分子的关键帧。本专利技术的目的是通过以下技术方案实现的。,其具体操作步骤为:步骤一、从待识别图像中识别单体目标,操作步骤包括:步骤1.1:轮廓模型(Deformable Part Models)集合中包含单体轮廓模型和关系轮廓模型。单体轮廓模型和关系轮廓模型均为mXn的矩阵模型,其中,m、n e (0,300),且m、η均为正整数。依次使用轮廓模型集合中的每个单体轮廓模型对待识别图像进行步骤1.2的操作。步骤1.2:使用当前单体轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来。经过步骤一的操作,可以得到待识别图像中的单体目标。步骤二、从待识别图像中识别关系目标,操作步骤包括:步骤2.1:依据搜索关键词,从轮廓模型集合中的关系模型子集中找到含有关键词的关系1?型。步骤2.2:依次使用步骤2.1得到的关系轮廓模型对待识别图像进行步骤2.3的操作。步骤2.3:使用当前关系轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来,得到关系目标。经过步骤二的操作,可以得到待识别图像中的关系目标。步骤三、确定候选主要目标区域。依次查看步骤二得到的每个关系目标是否包含步骤一得到的某个单体目标,如包含,则将该关系目标设定为候选主要目标区域。候选主要目标区域构成候选主要目标区域集合,用符号W表示,W= Iw1, W2,……,Wj,其中,r为候选主要目标区域的数量,Wi为候选主要目标区域,I≤i≤r。步骤四、从候选主要目标区域中确定主要目标,操作步骤包括:步骤4.1:对步骤三得到的候选主要目标区域集合W中的候选主要目标区域Wi依次进行步骤4.2至步骤4.5的操作。步骤4.2:对候选主要目标区域Wi使用17种不同的滤波器进行滤波,提取34维特征向量。所述17种不同的滤波器为9种遮罩(Law’s Masks)滤波器、2种颜色通道滤波器和6种纹理梯度滤波器。所述对候选主要目标区域Wi使用17种不同的滤波器进行滤波,提取34维特征向量的具体方法是:通过公式(I)在两种不同的维度下,计算候选主要目标区域和滤波器的卷积,获得34维的特征向量。【权利要求】1.,其特征在于:其具体操作步骤为: 步骤一、从待识别图像中识别单体目标,操作步骤包括: 步骤1.1:轮廓模型集合中包含单体轮廓模型和关系轮廓模型;单体轮廓模型和关系轮廓模型均为mXη的矩阵模型,其中,m、n e (0,300),且m、η均为正整数;依次使用轮廓模型集合中的每个单体轮廓模型对待识别图像进行步骤1.2的操作; 步骤1.2:使用当前单体轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来; 经过步骤一的操作,可以得到待识别图像中的单体目标; 步骤二、从待识别图像中识别关系目标,操作步骤包括: 步骤2.1:依据搜索关键词,从轮廓模型集合中的关系模型子集中找到含有关键词的关系1吴型; 步骤2.2:依次使用步骤2.1得到的关系轮廓模型对待识别图像进行步骤2.3的操作;步骤2.3:使用当前关系轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来,得到关系目标; 经过步骤二的操作,可以得到待识别图像中的关系目标; 步骤三、确定候选主要目标区域; 依次查看步骤二得到的每个关系目标是否包含步骤一得到的某个单体目标,如包含,则将该关系目标设定为候选主要目标区域;候选主要目标区域构成候选主要目标区域集合,用符号W表示,W= (W1, W2,......,wj ,其中,r为候选主要目标区域的数量,Wi为候选主要目标区域,KiSr; 步骤四、从候选主要目标区域中确定主要目标,操作步骤包括: 步骤4.1:对步骤三得到的候选主要目标区域集合W中的候选主要目标区域Wi本文档来自技高网
...

【技术保护点】
一种图像主要目标的定位与识别方法,其特征在于:其具体操作步骤为:步骤一、从待识别图像中识别单体目标,操作步骤包括:步骤1.1:轮廓模型集合中包含单体轮廓模型和关系轮廓模型;单体轮廓模型和关系轮廓模型均为m×n的矩阵模型,其中,m、n∈(0,300),且m、n均为正整数;依次使用轮廓模型集合中的每个单体轮廓模型对待识别图像进行步骤1.2的操作;步骤1.2:使用当前单体轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来;经过步骤一的操作,可以得到待识别图像中的单体目标;步骤二、从待识别图像中识别关系目标,操作步骤包括:步骤2.1:依据搜索关键词,从轮廓模型集合中的关系模型子集中找到含有关键词的关系模型;步骤2.2:依次使用步骤2.1得到的关系轮廓模型对待识别图像进行步骤2.3的操作;步骤2.3:使用当前关系轮廓模型,以逐像素的方法遍历待识别图像,将完全匹配成功的像素区域,用正好能覆盖的矩形框标记出来,得到关系目标;经过步骤二的操作,可以得到待识别图像中的关系目标;步骤三、确定候选主要目标区域;依次查看步骤二得到的每个关系目标是否包含步骤一得到的某个单体目标,如包含,则将该关系目标设定为候选主要目标区域;候选主要目标区域构成候选主要目标区域集合,用符号W表示,W={w1,w2,……,wr},其中,r为候选主要目标区域的数量,wi为候选主要目标区域,1≤i≤r;步骤四、从候选主要目标区域中确定主要目标,操作步骤包括:步骤4.1:对步骤三得到的候选主要目标区域集合W中的候选主要目标区域wi依次进行步骤4.2至步骤4.5的操作;步骤4.2:对候选主要目标区域wi使用17种不同的滤波器进行滤波,提取34维特征向量;步骤4.3:将候选主要目标区域wi分割为K个大小为3×3像素的图像块,K是候选主要目标区域wi能够分成的图像块的个数;步骤4.4:遍历候选主要目标区域wi中的3×3像素的图像块,用符号kj表示当前3×3像素的图像块,将图像块kj扩展为3种不同分辨率的图像,非别是原始分辨率图像、1/3原始分辨率图像和1/9原始分辨率图像;步骤4.5:使用联合高斯马尔科夫随机场,求解公式(2)的最大似然概率计算候选主要目标区域wi的绝对深度值;P(d|X;θ,σ)=1Zexp(-Σj=1K(dj(1)-xjTθ)22σ12-Σs=13Σj=1KΣv∈Ns(dj(s)-dv(s))22σ22)---(2)]]>其中,P(d|X;θ,σ)表示最大似然概率,也是候选主要目标区域wi在3种分辨率下的最有可能处于的绝对深度值;Z是归一化参数;exp()表示e的指数函数;K表示候选主要目标区域wi中3×3像素的图像块数量;dj(s)代表图像块j在分辨率s中的相对深度,dj(s)的取值范围是(0,80),单位为米;s的取值为1或1/3或1/9;xj表示图像块j的绝对深度向量,xj的取值范围是(0,80),单位为米;θ、σ1、σ2是模型参数;Ns代表在尺度s下与图像块j相邻的四个图像块;步骤4.6:设定阈值,将绝对深度值小于阈值的所有图像块标记为主要目标区域,主要目标区域中的对象即为图像中的主要目标。...

【技术特征摘要】

【专利技术属性】
技术研发人员:李侃白琳徐琛
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1