一种基于音频指纹的两层广告音频检索方法技术

技术编号:10968186 阅读:130 留言:0更新日期:2015-01-28 20:08
本发明专利技术涉及一种基于音频指纹的两层广告音频检索方法,该方法包括两大步骤:步骤一,基于音频的频谱幅度特征,提取两种不同维度的音频指纹;步骤二,基于这两种音频指纹进行两层检索。本发明专利技术基于音频指纹技术,实现广告的准确匹配。一方面提取的音频指纹具有很好的抗噪性,使广告匹配具有很高的准确率,另一方面,音频指纹较原始音频数据小的多,同时应用两层检索方法,能够快速的进行检索。所以,该方法在商业应用和科学研究领域均有广泛地实用价值和应用前景。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及,该方法包括两大步骤:步骤一,基于音频的频谱幅度特征,提取两种不同维度的音频指纹;步骤二,基于这两种音频指纹进行两层检索。本专利技术基于音频指纹技术,实现广告的准确匹配。一方面提取的音频指纹具有很好的抗噪性,使广告匹配具有很高的准确率,另一方面,音频指纹较原始音频数据小的多,同时应用两层检索方法,能够快速的进行检索。所以,该方法在商业应用和科学研究领域均有广泛地实用价值和应用前景。【专利说明】
本专利技术涉及一种新型的广告音频检索方法,具体涉及一种基于两种音频指纹的两 层检索方法,属于计算机科学的多媒体信息检索领域。
技术介绍
音频指纹是指能够代表一段音频特征的基于内容的紧致数字签名,其目的是计算 一段音频的基于内容的特征,以在音频特征数据库中进行检索匹配。音频指纹是针对音频 的物理数据,而不是使用名字、作者等信息.音频指纹要求具有鲁棒性以使音频检索具有 一定的抗噪性,要求具有区分性以区分不同的音频。 现在,音乐搜索方式除了传统的按名搜索,基于内容的搜索也已经得到的广泛应 用。广告匹配领域也开始应用音频指纹技术。广告音频在商业意义上是一种宣传或营销手 段等,在物理信号上具有比音乐更复杂的形式,可能是人声、乐器、或多者混合而不仅限于 音乐,因而单纯基于音乐的特殊特征的音频指纹的方法不适用于广告音频检索。所以研究 一种针对广告音频的音频指纹方法具有重要意义。
技术实现思路
本专利技术的目的是利用广告音频的特征提取两种音频指纹,并提供一种基于音频指 纹的两层检索方法。针对目前广告匹配领域的需求,该方法通过对电视等声源进行录音,经 过一系列的操作,提取广告音频的音频指纹,并在服务器端进行两层的检索,最终根据检索 的结果返回相应的广告服务。 根据本专利技术的一个实施例的基于音频指纹的两层广告音频检索方法包括: (1)步骤Sl:基于音频的频谱幅度特征,提取两种不同维度的音频指纹,具体包 括: a)使用手机等设备对电视等声源进行录音; b)对音频的data部分进行加窗分帧操作,得到257帧数据。其中窗函数为汉宁 窗,每一巾贞的长度为0. 37S,巾贞之间的重叠为31/32 ; c)对于每一帧数据进行傅里叶变换,得到相应的频域数据; d)对于每一帧的频域数据,对每一个数据进行求模运算,得到频谱幅度; e)把257帧的频率在300HZ-5400HZ的频谱幅度数据分别求和,得到257帧的 整体频谱幅度和,称为SGA(SumOfGlobalAptitude),这样通过以下公式计算音频指纹 I(FPl): FPl =i1: ifSGALi+ 1]-SGALi] >0 L J L J I 0; ifSGALi + l]-SGALi] <0 f)对于每一帧频谱幅度数据,把频带在300Hz-5400Hz数据按对数间隔,划 分为33个频率带,分别计算每一帧每一个频带的频谱幅度和,称为SBA(SumOfBand Aptitude),从而通过以下公式计算音频指纹2 (FP2): 【权利要求】1. ,基于音频的频谱幅度,提取了两种不 同维度的音频指纹,并基于该两种音频指纹进行了两层检索,其特征在于该方法包括以下 步骤: 步骤一:基于音频的频谱幅度特征,提取两种不同维度的音频指纹; 步骤二:基于这两种音频指纹进行两层检索。 其中 步骤一中,对所述两种不同维度的音频指纹均需要计算频谱的平均幅度,音频指纹1 基于每一帧数据的整体频谱幅度和的差值,音频指纹2基于每一帧数据划分频带后的局部 频谱幅度和的差值。2. 根据权利要求1所述的,其特征在于: 在步骤二所述的基于这两种音频指纹进行两层检索中,第一层检索是指检索音频指纹1,在 一定条件下,进入第二层检索,检索音频指纹2。【文档编号】G10L25/03GK104317967SQ201410655665【公开日】2015年1月28日 申请日期:2014年11月17日 优先权日:2014年11月17日 【专利技术者】肖利民, 隋东辉, 阮利, 祝明发, 李书攀 申请人:北京航空航天大学本文档来自技高网...

【技术保护点】
一种基于音频指纹的两层广告音频检索方法,基于音频的频谱幅度,提取了两种不同维度的音频指纹,并基于该两种音频指纹进行了两层检索,其特征在于该方法包括以下步骤:步骤一:基于音频的频谱幅度特征,提取两种不同维度的音频指纹;步骤二:基于这两种音频指纹进行两层检索。其中步骤一中,对所述两种不同维度的音频指纹均需要计算频谱的平均幅度,音频指纹1基于每一帧数据的整体频谱幅度和的差值,音频指纹2基于每一帧数据划分频带后的局部频谱幅度和的差值。

【技术特征摘要】

【专利技术属性】
技术研发人员:肖利民隋东辉阮利祝明发李书攀
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1