一种广告序列图像快速检索和分析方法技术

技术编号:13958678 阅读:98 留言:0更新日期:2016-11-02 19:20
本发明专利技术公开了一种广告序列图像快速检索和分析方法,该方法为:利用图像复杂度特征和决策分类树的方法,对广告图像数据库分为LOGO和场景图像;其次,对广告数据库中图像提取和存储HOG特征和SIFT特征;提取待匹配图像的HOG特征和SIFT特征,计算待匹配图像与广告数据库中所有与其相同类型图像的HOG特征向量的欧氏距离,并对其欧氏距离由小到大进行排序,筛选出其前S张候选图像;计算其与待匹配图像的SIFT特征匹配点对数并将对数最多的图像作为待匹配图像所对应的图像;针对广告序列的待匹配图像,计算每段广告的时长,获得广告播放信息。本发明专利技术不仅保证了匹配的正确率,而且节省了运算时间,提高了图像检索的效率。

【技术实现步骤摘要】

本专利技术属于图像匹配和检索
,具体涉及一种广告序列图像快速检索和分析方法
技术介绍
目前,随着社会经济的高速发展,广告已经成为了一种十分重要的商业宣传和营销手段,公司和企业投放大量广告在电视、电影等公共媒体平台,以获得巨大的经济收益。而随着广告播放量的增大,广告品类的繁多,为了监督广告的播放情况,获取相关数据信息,如何准确而快速的检索广告片段,成为一个亟待解决的问题。目前,广告检索大多是通过人工进行,既浪费时间又消耗人力,尤其对于海量数据库,人工和时间成本过高。因此,针对广告图像的快速自动检索方法成为当下的一种重要的市场需求。对于广告图像的检测,通常采用基于内容的图像检索技术。图像处理中,基于内容的图像检索关键技术是特征提取,其目的是获得图像本身包含的客观视觉特性,不需要人为干预和解释,能够通过计算机自动实现对图像特征的定位、描述和存储。局部特征是图像特征的局部表达,它能反映图像上具有的局部特殊性,具有尺度不变、旋转不变、平移不变等特点,并且对于光照及色彩变化、噪声等具有一定的鲁棒性,因此,适合利用图像的局部信息进行图像匹配和检索。角点特征是一种常用的局部特征,相应的特征提取算子有SIFT(Scale Invariant Feature Transform,尺度不变特征变换)、SURF(Speeded Up Robust Features,快速鲁棒特征)等,可以实现局部特征的提取和匹配,鲁棒性好,但计算复杂度高,尤其对于海量数据,无法做到高效的图像检索和匹配。另一种局部特征是HOG(Histogram of Oriented Gradients,方向梯度直方图),它是根据统计图像局部区域的梯度方向直方图来构成特征,是目前计算机视觉、模式识别领域很常用的一种描述图像局部纹理的特征。HOG的计算复杂度低,对于图像中简单目标物有较好的识别能力,但在处理复杂目标物时准确率明显下降。
技术实现思路
有鉴于此,本专利技术提供了一种广告序列图像快速检索和分析方法,本专利技术不仅能够解决图像角度、亮度、色彩、尺度等改变带来的影响,保证了匹配的正确率,而且节省了运算时间,提高了图像检索的效率。实现本专利技术的具体实施方案如下:一种广告序列图像快速检索和分析方法,具体步骤如下:步骤一:广告数据库中图像的分类:利用图像复杂度特征和决策分类树的方法,对广告图像数据库进行图像分类处理,即分为LOGO和场景图像两大类;步骤二:广告数据库中图像的特征提取:基于HOG算子,对广告数据库中图像提取HOG特征,同时对广告数据库中图像的SIFT特征进行提取,并存储广告数据库中图像的HOG特征和SIFT特征信息;步骤三:待匹配图像的分类和特征提取:根据图像复杂度特征和决策分类树的方法判定待匹配图像的类型为LOGO或者场景图像,提取待匹配图像的HOG特征和SIFT特征;步骤四:初步快速筛选广告数据库图像:计算待匹配图像与广告数据库中所有与其相同类型图像的HOG特征向量的欧氏距离,并对数据库图像根据所获得的欧氏距离由小到大进行排序,从排序后的数据库中筛选出前S张数据库图像作为候选图像;步骤五:对候选图像进行精确检索:对S张候选图像分别计算其与待匹配图像的SIFT特征匹配点对数,获得匹配点对数最多的图像作为待匹配图像在广告数据库中所对应的图像;步骤六:对广告序列的待匹配图像进行分析:对广告序列的待匹配图像进行编号,按照步骤三到五,获得每张待匹配图像在广告数据库中所对应的图像;按数据库中对应的图像所属广告片段的标号为待匹配图像进行标号,将具有相同标号的待匹配图像归为一类;针对每一类基于待匹配图像截图频率和编号差,计算每段广告的时长,最后将各段广告内容以及时长制表统计,获得广告播放信息。进一步地,S的取值范围为1<S≤30。进一步地,步骤一具体步骤包括:第1步:利用Canny边缘检测的算法提取广告数据库中图像的边缘信息,根据先验知识设置广告数据库中图像中心区域的初始位置(x0,y0,x′0,y′0);依据初始中心区域内的边缘信息,对广告数据库中图像的初始中心区域进行收缩,假设初始中心区域内边缘的坐标为(xi,yi),其中i=1…L,收缩后的中心区域的准确位置为:x0=min(xi)x′0=max(xi)y0=min(yi)y′0=max(yi)第2步:计算收缩后的中心区域和非中心区域的边缘比率,则有:中心区域的边缘比率=中心区域的边缘像素数/中心区域的面积非中心区域的边缘比率=(图像的边缘像素数-中心区域的边缘像素数)/(图像的面积-中心区域的面积)第3步:将中心区域边缘比率、非中心区域的边缘比率和两者之比作为图像复杂度的三个特征量,再利用决策分类树的方法将图像分为LOGO和场景图像两类。进一步地,步骤二提取待匹配图像的HOG特征具体步骤包括:第1步:将数据库中每幅图像划分均匀分布的为F×F个相同大小的块,且相邻块间是相互重叠的,每个块记为一个细胞单元,并计算每个细胞单元的Q个梯度方向直方图;Q为梯度方向直方图的条数;第2步:将每个细胞单元的的梯度方向直方图组合起来构成HOG特征向量,则每幅图像的HOG特征为F×F×Q维向量。进一步地,F的取值范围为2≤F≤4,Q的取值范围为8≤Q≤12。进一步地,步骤六的具体步骤如下:第1步:针对广告序列的待匹配图像,对广告序列的待匹配图像进行编号,按照步骤三到五,获得每张待匹配图像在广告数据库中所对应的图像,剔除广告序列中待匹配图像匹配点对数少于H的图像;第2步:将其余的待匹配图像依据数据库中对应的图像所述广告片段的标号为待匹配图像进行标号,且同一广告中的图像具有相同的标号;统计具有相同标号的图像个数,剔除少于连续K张具有相同标号的图像;第3步:根据广告序列中待匹配图像的截图频率和编号差,根据计算每段广告的时长方法,获得广告段播放的时长,最后将各段广告内容以及时长制表统计,获得广告播放信息。进一步地,K取3,H取4。进一步地,每段广告的时长的计算方法为:将分类好的图像按照图像的编号顺序排列,选取首尾两张图像的编号,假设首尾两张图像的编号分别为p1和pn,则该段广告所截取的图像的数量N为N=pn-p1+1,根据截图帧频f,单位为张/秒,获得广告段播放的时长T=N/f。有益效果:(1)本专利技术是基于广告片段的快速图像匹配与检索方法,首先将广告数据库中图像和待匹配图像进行图像分类处理,即分为LOGO和场景图像两类,有利于提高后续的图像匹配和检索的速度及正确率;(2)本专利技术采用SIFT特征可以克服翻拍图像存在的角度和尺度变化影响,鲁棒性好;通过采用HOG特征初步筛选出候选图像,再将SIFT局部特征用于精确检索的方法,进一步提升了运算速度,同时保证了检索正确率;其中,SIFT特征匹配过程采用双向匹配法,有利于提高检索结果的准确性,并且采用多线程并行计算,充分利用计算机的硬件性能,改善程序运行效率,达到了快速检索的目的。(3)本专利技术公开的一种广告序列图像快速检索和分析方法,不仅具有较高的商业实用价值,实现了广告片段的自动检索分类和时长计算,而且可以应用于广告监督、播放数据统计与分析、实时广告检索等项目,满足该领域实际的市场需求,尤其对于海量数据库的广告检索,相比于现有的广告段检索方法有明显的速度优势,节省了大量人本文档来自技高网
...

【技术保护点】
一种广告序列图像快速检索和分析方法,其特征在于,具体步骤如下:步骤一:广告数据库中图像的分类:利用图像复杂度特征和决策分类树的方法,对广告图像数据库进行图像分类处理,即分为LOGO和场景图像两大类;步骤二:广告数据库中图像的特征提取:基于HOG算子,对广告数据库中图像提取HOG特征,同时对广告数据库中图像的SIFT特征进行提取,并存储广告数据库中图像的HOG特征和SIFT特征信息;步骤三:待匹配图像的分类和特征提取:根据图像复杂度特征和决策分类树的方法判定待匹配图像的类型为LOGO或者场景图像,提取待匹配图像的HOG特征和SIFT特征;步骤四:初步快速筛选广告数据库图像:计算待匹配图像与广告数据库中所有与其相同类型图像的HOG特征向量的欧氏距离,并对数据库图像根据所获得的欧氏距离由小到大进行排序,从排序后的数据库中筛选出前S张数据库图像作为候选图像;步骤五:对候选图像进行精确检索:对S张候选图像分别计算其与待匹配图像的SIFT特征匹配点对数,获得匹配点对数最多的图像作为待匹配图像在广告数据库中所对应的图像;步骤六:对广告序列的待匹配图像进行分析:对广告序列的待匹配图像进行编号,按照步骤三到五,获得每张待匹配图像在广告数据库中所对应的图像;按数据库中对应的图像所属广告片段的标号为待匹配图像进行标号,将具有相同标号的待匹配图像归为一类;针对每一类基于待匹配图像截图频率和编号差,计算每段广告的时长,最后将各段广告内容以及时长制表统计,获得广告播放信息。...

【技术特征摘要】
1.一种广告序列图像快速检索和分析方法,其特征在于,具体步骤如下:步骤一:广告数据库中图像的分类:利用图像复杂度特征和决策分类树的方法,对广告图像数据库进行图像分类处理,即分为LOGO和场景图像两大类;步骤二:广告数据库中图像的特征提取:基于HOG算子,对广告数据库中图像提取HOG特征,同时对广告数据库中图像的SIFT特征进行提取,并存储广告数据库中图像的HOG特征和SIFT特征信息;步骤三:待匹配图像的分类和特征提取:根据图像复杂度特征和决策分类树的方法判定待匹配图像的类型为LOGO或者场景图像,提取待匹配图像的HOG特征和SIFT特征;步骤四:初步快速筛选广告数据库图像:计算待匹配图像与广告数据库中所有与其相同类型图像的HOG特征向量的欧氏距离,并对数据库图像根据所获得的欧氏距离由小到大进行排序,从排序后的数据库中筛选出前S张数据库图像作为候选图像;步骤五:对候选图像进行精确检索:对S张候选图像分别计算其与待匹配图像的SIFT特征匹配点对数,获得匹配点对数最多的图像作为待匹配图像在广告数据库中所对应的图像;步骤六:对广告序列的待匹配图像进行分析:对广告序列的待匹配图像进行编号,按照步骤三到五,获得每张待匹配图像在广告数据库中所对应的图像;按数据库中对应的图像所属广告片段的标号为待匹配图像进行标号,将具有相同标号的待匹配图像归为一类;针对每一类基于待匹配图像截图频率和编号差,计算每段广告的时长,最后将各段广告内容以及时长制表统计,获得广告播放信息。2.如权利要求1所述一种广告序列图像快速检索和分析方法,其特征在于,S的取值范围为1<S≤30。3.如权利要求1所述一种广告序列图像快速检索和分析方法,其特征在于,步骤一具体步骤包括:第1步:利用Canny边缘检测的算法提取广告数据库中图像的边缘信息,根据先验知识设置广告数据库中图像中心区域的初始位置(x0,y0,x′0,y′0);依据初始中心区域内的边缘信息,对广告数据库中图像的初始中心区域进行收缩,假设初始中心区域内边缘的坐标为(xi,yi),其中i=1…L,收缩后的中心区域的准确位置为:x0=min(xi)x′0=max(xi)y0=min(yi)y′0=max(yi)第2...

【专利技术属性】
技术研发人员:李慧琦汪淑梦康杰靓
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1