用于比较视频镜头的方法和系统技术方案

技术编号:16049078 阅读:19 留言:0更新日期:2017-08-20 08:49
一种用于将包括第一图像的第一集合(I1(s))的第一视频镜头(Vs1)与包括第二图像的第二集合(I2(t))的第二视频镜头(Vs2)进行比较的方法(100),第一集合和第二集合之间的至少一个包括至少两个图像。该方法包括将第一集合的每个第一图像与第二集合的每个第二图像配对(110)以形成多个图像对(IP(m)),以及,对于每个图像对,实施操作a)‑g):a)识别(120)第一图像中的第一兴趣点和第二图像中的第二兴趣点;b)将第一兴趣点与对应的第二兴趣点相关联(120)以形成对应的兴趣点匹配;c)对于每对第一兴趣点,计算(130)该对第一兴趣点之间的距离以用于获得对应的第一长度;d)对于每对第二兴趣点,计算(130)该对第二兴趣点之间的距离以用于获得对应的第二长度;e)计算多个距离比(130),每个距离比对应于选定的兴趣点匹配对,并且是基于第一项与第二项之比或者基于第二项与第一项之比,所述第一项对应于所述兴趣点匹配对的第一兴趣点之间的距离,所述第二项对应于所述兴趣点匹配对的第二兴趣点之间的距离;f)计算(140)多个计算距离比的统计分布的第一表示;g)计算(150)在所述图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二表示。该方法还包括基于所有图像对的第一表示来生成(160)对所有图像对计算的多个计算距离比的统计分布的第一全局表示;基于所有图像对的第二表示来生成(170)在所有图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二全局表示;将所述第一全局表示与所述第二全局表示进行比较(180);并且基于所述比较来评估(190)第一视频镜头是否包含第二视频镜头中所描绘的物体的视图。

【技术实现步骤摘要】
【国外来华专利技术】用于比较视频镜头的方法和系统
本专利技术涉及图像分析领域。
技术介绍
在图像分析领域中,常见操作提供在两个图像都包括相同场景或相同物体的至少一部分的情况下将这两个图像进行比较以便找到在它们之间蕴含(occur)的关系。用于确定两个图像是否显示相同物体的已知方法提供选择第一图像中的所谓兴趣点的集合、然后将该集合或者其子集的每个兴趣点与第二图像中的对应兴趣点匹配(通常,该集合的选定兴趣点中的一些由于模糊性(ambiguity)而可能不能被匹配)。第一图像的哪个点应成为兴趣点的选择是通过考虑该图像围绕该点本身的区域中的图像特征来实施的。如本领域技术人员众所周知的,如果第一图像的兴趣点和第二图像的对应兴趣点之间的匹配从两个兴趣点都对应于相同物体(在两个图像中都被描绘)的相同点的意义上来讲是正确的,则这样的兴趣点匹配被称为“内群点”。相反,如果第一图像的兴趣点和第二图像的对应兴趣点之间的匹配从两个兴趣点不对应于相同物体的相同点的意义上来讲是不正确的,则这样的兴趣点匹配被称为“离群点”。因此,为了获得可靠的结果,能够区分内群点和离群点的过程在兴趣点匹配已经被确定之后被有利地执行。这种类型的过程的数个例子在本领域中已经是已知的,诸如例如以本申请人的名义的专利申请WO2012/100819中公开的图像比较方法。图像分析领域中的另一常见操作提供在两个视频镜头或者图像和视频镜头两者都包括相同场景或相同物体的至少一部分的情况下将视频镜头进行比较或者将单个图像与视频镜头的图像进行比较以便找到在它们之间蕴含的关系。例如,A.Araujo、M.Makar、V.Chandrasekhar、D.Chen、S.Tsai、H.Chen、R.Angst、B.Girod在2014年10月IEEEInternationalConferenceonImageprocessing上的″Efficientvideosearchusingimagequeries″公开了一种将图像与视频镜头进行比较的方法,该方法使用随机采样一致性(RANSAC)迭代方法来检查几何一致性。F.Rothganger、S.Lazebnik、C.Schmid和J.Ponce在2007年IEEETransactionsonPatternAnalysisandMachineIntelligence,29(3)第477-491页上的″Segmenting,modeling,andmatchingvideoclipscontainingmultiplemoving0bjects″中公开的方法提供了一种用于识别视频片段中的描绘相同场景的镜头的方法。在这种情况下,同样地使用RANSAC方法来检查几何一致性。
技术实现思路
申请人已经发现,本领域中已知的用于对视频镜头进行比较或者将单个图像与视频镜头的图像进行比较的解决方案受严重的缺点的影响。在视频镜头包括非常小的物体时和/或在视频镜头包括不详细的物体的情况下,已知解决方案缺乏鲁棒性。事实上,在这些情况下,只有少量兴趣点可以在所述物体内被识别,使得在比较操作期间可能无法识别这些物体。申请人已经解决了如何就鲁棒性而言改进已知解决方案的问题。申请人已经发现,给定两个视频镜头,每个视频镜头包括相应的图像组或图像集合,通过彼此累积与包括第一视频镜头的图像和第二视频镜头的图像的每个图像对相对应的兴趣点距离比的直方图,可以计算全局直方图,该全局直方图表示对所有图像对计算的距离比的统计分布。由于所述累积,与细节少和/或不佳的物体相对应的很少的选定兴趣点的贡献明显增大。本专利技术的一方面提供了一种用于将包括第一图像的第一集合的第一视频镜头与包括第二图像的第二集合的第二视频镜头进行比较的方法,第一集合和第二集合之间的至少一个包括至少两个图像,该方法包括将第一集合的每个第一图像与第二集合的每个第二图像配对以形成多个图像对。该方法还包括,对于每个图像对,实施操作a)-g):a)识别第一图像中的第一兴趣点和第二图像中的第二兴趣点;b)将第一兴趣点与对应的第二兴趣点相关联以形成对应的兴趣点匹配;c)对于每对第一兴趣点,计算该对第一兴趣点之间的距离以用于获得对应的第一长度;d)对于每对第二兴趣点,计算该对第二兴趣点之间的距离以用于获得对应的第二长度;e)计算多个距离比,每个距离比对应于选定的兴趣点匹配对,并且是基于第一项与第二项之比或者基于第二项与第一项之比,所述第一项对应于所述兴趣点匹配对的第一兴趣点之间的距离,所述第二项对应于所述兴趣点匹配对的第二兴趣点之间的距离;f)计算多个计算距离比的统计分布的第一表示;g)计算在所述图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二表示。该方法还包括基于所有图像对的第一表示来生成对所有图像对计算的多个计算距离比的统计分布的第一全局表示,并且基于所有图像对的第二表示来生成在所有图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二全局表示。该方法还包括将所述第一全局表示与所述第二全局表示进行比较,并且基于所述比较来评估第一视频镜头是否包含第二视频镜头中所描绘的物体的视图。根据本专利技术的实施例,操作f)提供将多个距离比布置在具有多个有序区间的对应的图像对直方图中,每个有序区间对应于距离比值的相应间隔,图像对直方图对于每个区间确定具有被包括在相应间隔内的值的计算距离比的对应数量。根据本专利技术的实施例,操作提供生成图像对离群点概率质量函数,该图像对离群点概率质量函数对于所述区间中的每个包括:在所有兴趣点匹配都是离群点的假设下距离比具有落在所述区间内的值的概率。根据本专利技术的实施例,基于所有图像对的第一表示来生成对所有图像对计算的多个计算距离比的统计分布的第一全局表示的阶段包括基于图像对直方图来生成全局直方图,所述全局直方图指示对所有图像对计算的距离比的值在区间之间是如何分布的。根据本专利技术的实施例,基于所有图像对的第二表示来生成在所有图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二全局表示的阶段包括通过组合图像对离群点概率质量函数来生成全局离群点概率质量函数。根据本专利技术的实施例,将所述第一全局表示与所述第二全局表示进行比较的阶段包括将所述全局直方图与所述全局离群点概率质量函数进行比较。根据本专利技术的实施例,基于图像对直方图生成全局直方图的阶段包括对于多个有序区间中的每个区间,对与所有图像对直方图的该区间相对应的计算距离比的数量进行求和。根据本专利技术的实施例,生成图像对离群点概率质量函数的阶段包括计算图像对离群点概率质量函数的线性组合。根据本专利技术的实施例,将所述第一全局表示与所述第二全局表示进行所述比较包括执行Pearson检验。根据本专利技术的实施例,所述计算距离比提供计算距离比的对数。本专利技术的另一方面提供一种视频镜头比较系统,该视频镜头比较系统包括被配置为接收包括第一图像的第一集合的第一视频镜头并且识别第一图像中的第一兴趣点的第一单元和存储多个第二视频镜头的参考数据库,其中每个第二视频镜头包括第二图像的相应的第二集合;该视频镜头比较系统进一步包括第二单元,该第二单元被配置为对于每个第二视频镜头、并且对于包括所述第二视频镜头的第二图像和第一视频镜头的第一图像的每个图像对,将所述第一图像中的本文档来自技高网
...
用于比较视频镜头的方法和系统

【技术保护点】
一种用于将包括第一图像的第一集合(11(s))的第一视频镜头(Vs1)与包括第二图像的第二集合(I2(t))的第二视频镜头(Vs2)进行比较的方法(100),第一集合和第二集合之间的至少一个包括至少两个图像,该方法包括:‑将第一集合的每个第一图像与第二集合的每个第二图像配对(110)以形成多个图像对(IP(m));‑对于每个图像对,实施操作a)‑g):a)识别(120)第一图像中的第一兴趣点和第二图像中的第二兴趣点;b)将第一兴趣点与对应的第二兴趣点相关联(120)以形成对应的兴趣点匹配;c)对于每对第一兴趣点,计算(130)该对第一兴趣点之间的距离以用于获得对应的第一长度;d)对于每对第二兴趣点,计算(130)该对第二兴趣点之间的距离以用于获得对应的第二长度;e)计算多个距离比(130),每个距离比对应于选定的兴趣点匹配对,并且是基于第一项与第二项之比或者基于第二项与第一项之比,所述第一项对应于所述兴趣点匹配对的第一兴趣点之间的距离,所述第二项对应于所述兴趣点匹配对的第二兴趣点之间的距离;f)计算(140)多个计算距离比的统计分布的第一表示;g)计算(150)在所述图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二表示;‑基于所有图像对的第一表示来生成(160)对所有图像对计算的多个计算距离比的统计分布的第一全局表示;‑基于所有图像对的第二表示来生成(170)在所有图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二全局表示;‑将所述第一全局表示与所述第二全局表示进行比较(180);并且‑基于所述比较来评估(190)第一视频镜头是否包含第二视频镜头中所描绘的物体的视图。...

【技术特征摘要】
【国外来华专利技术】1.一种用于将包括第一图像的第一集合(11(s))的第一视频镜头(Vs1)与包括第二图像的第二集合(I2(t))的第二视频镜头(Vs2)进行比较的方法(100),第一集合和第二集合之间的至少一个包括至少两个图像,该方法包括:-将第一集合的每个第一图像与第二集合的每个第二图像配对(110)以形成多个图像对(IP(m));-对于每个图像对,实施操作a)-g):a)识别(120)第一图像中的第一兴趣点和第二图像中的第二兴趣点;b)将第一兴趣点与对应的第二兴趣点相关联(120)以形成对应的兴趣点匹配;c)对于每对第一兴趣点,计算(130)该对第一兴趣点之间的距离以用于获得对应的第一长度;d)对于每对第二兴趣点,计算(130)该对第二兴趣点之间的距离以用于获得对应的第二长度;e)计算多个距离比(130),每个距离比对应于选定的兴趣点匹配对,并且是基于第一项与第二项之比或者基于第二项与第一项之比,所述第一项对应于所述兴趣点匹配对的第一兴趣点之间的距离,所述第二项对应于所述兴趣点匹配对的第二兴趣点之间的距离;f)计算(140)多个计算距离比的统计分布的第一表示;g)计算(150)在所述图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二表示;-基于所有图像对的第一表示来生成(160)对所有图像对计算的多个计算距离比的统计分布的第一全局表示;-基于所有图像对的第二表示来生成(170)在所有图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二全局表示;-将所述第一全局表示与所述第二全局表示进行比较(180);并且-基于所述比较来评估(190)第一视频镜头是否包含第二视频镜头中所描绘的物体的视图。2.根据权利要求1所述的方法(100),其中,操作f)提供将多个距离比布置在具有多个有序区间的对应的图像对直方图中,每个有序区间对应于距离比值的相应间隔,图像对直方图对于每个区间确定具有被包括在相应间隔内的值的计算距离比的对应数量。3.根据权利要求2所述的方法(100),其中,操作g)提供生成图像对离群点概率质量函数,该图像对离群点概率质量函数对于所述区间中的每个包括:在所有兴趣点匹配都是离群点的假设下距离比具有落在所述区间内的值的概率。4.根据权利要求3所述的方法(100),其中,基于所有图像对的第一表示来生成对所有图像对计算的多个计算距离比的统计分布的第一全局表示的阶段包括基于图像对直方图来生成全局直方图,所述全局直方图指示对所有图像对计算的距离比的值在区间之间是如何分布的。5.根据权利要求4所述的方法(100),其中,基于所有图像对的第二表示来生成在所有图像对中的所有兴趣点匹配都是离群点的假设下获得的距离比的统计分布的第二全局表示的阶段包括通过组合图像对离群点概率质量函数来生成全局离群点概率质量函数。6.根据权利要求5所述的...

【专利技术属性】
技术研发人员:S·莱普索伊M·巴勒斯特里G·弗兰希尼
申请(专利权)人:意大利电信股份公司
类型:发明
国别省市:意大利,IT

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1