【技术实现步骤摘要】
一种广播音频中广告检索的方法和装置
本专利技术涉及音频检索
,特别是指一种广播音频中广告检索的方法和装置。
技术介绍
视频包含了音频的属性内容,因此对音频特征的研究具有更广泛的应用意义。广播电台的音频内容监播,一直都是媒体监管工作的重要部分。广播每天都会产生众多的音频数据,如何对这些数据进行高效准确的检测,是本研究算法的重点和难点。本专利技术要解决的问题——在广播音频中查找广告样例音频并定位该条广告的具体时间位置,这是一个典型的音频样例检索应用。荷兰的Philips研究院利用音频中频谱子带间的关系构建Philips音频指纹,对所有可能的Philips指纹建立一张快速查找表LUT(lookuptable),然后将快速查找表中的每个指纹与音频指纹库中的子指纹建立关联。当需要检索音频时,对待检索音频提取一个指纹块,根据指纹块中的子指纹在快速查找表中定位到包含该子指纹的所有音频中,再进行精确相似匹配,最后确定相似值,根据相似程度返回检索结果。为了提高检索效率,Philips检索算法采用候选子指纹策略进行索引,候选子指纹要求没有比特误差或比特误差很小。候选子指纹的确立 ...
【技术保护点】
1.一种广播音频中广告检索的方法,其特征在于,包括:获取待检测音频和模板音频,将所述待检测音频和所述模板音频转化为相同格式;对所述模板音频进行音频指纹提取获得第一音频指纹,将所述第一音频指纹存储到数据库中;所述第一音频指纹包括多条按顺序存储的第一子指纹;对所述待检测音频进行音频指纹提取获得第二音频指纹,所述第二音频指纹包括多条按顺序存储的第二子指纹,选择连续出现至少三次的所述第二子指纹作为候选子指纹;根据所述候选子指纹在所述数据库中检索,判断所述候选子指纹是否存在于所述数据库中;若是,则计算与所述候选子指纹对应的所述第二音频指纹与所述第一音频指纹的差异度系数,根据所述差异度 ...
【技术特征摘要】
1.一种广播音频中广告检索的方法,其特征在于,包括:获取待检测音频和模板音频,将所述待检测音频和所述模板音频转化为相同格式;对所述模板音频进行音频指纹提取获得第一音频指纹,将所述第一音频指纹存储到数据库中;所述第一音频指纹包括多条按顺序存储的第一子指纹;对所述待检测音频进行音频指纹提取获得第二音频指纹,所述第二音频指纹包括多条按顺序存储的第二子指纹,选择连续出现至少三次的所述第二子指纹作为候选子指纹;根据所述候选子指纹在所述数据库中检索,判断所述候选子指纹是否存在于所述数据库中;若是,则计算与所述候选子指纹对应的所述第二音频指纹与所述第一音频指纹的差异度系数,根据所述差异度系数与预设阈值的关系判断所述待检测音频与所述模板音频的关系。2.根据权利要求1所述的广播音频中广告检索的方法,其特征在于,所述对所述模板音频进行音频指纹提取获得第一音频指纹包括对所述模板音频进行提取Philips音频指纹获得所述第一音频指纹;对所述待检测音频进行音频指纹提取获得第二音频指纹包括对所述待检测音频进行提取Philips音频指纹获得所述第二音频指纹。3.根据权利要求2所述的广播音频中广告检索的方法,其特征在于,所述音频指纹提取包括:对音频加汉明窗做分帧处理,得到多个单帧音频片段;对每个所述的单帧音频片段进行快速傅里叶变换,获取音频频谱信号;将每个所述的音频频谱信号中300-2000HZ的频段划分为至少M+1个不重叠的子频段,并针对M+1个所述的子频段分别计算能量值,计算公式如下:其中,E(n,m)表示第n帧音频频谱信号在第m个子频段的能量,|Xn(i)|表示第n帧音频频谱信号,f(m)~f(m+1)表示子频段m的范围,M为整数且14≤M≤32;计算当前帧相邻两个子频段的能量差并和前一帧相同位置的两个子频段的能量差进行比较,获取包含M位比特的音频指纹,其中获取音频指纹的具体计算公式如下:其中,F(n,m)表示第n帧音频指纹的第m个比特。4.根据权利要求1所述的广播音频中广告检索的方法,其特征在于,所述对所述模板音频进行音频指纹提取获得第一音频指纹,将所述第一音频指纹存储到数据库中,包括:在所述数据库中创建模板音频指纹表和子指纹表;将所述第一音频指纹存储到所述模板音频指纹表中;将所述第一音频指纹中包含的每一条所述子指纹及每一条所述子指纹在所述第一音频指纹中对应的位置存储到所述子指纹表中。5.根据权利要求4所述的广播音频中广告检索的方法,其特征在于,所述将所述第一音频指纹中包含的每一条所述子指纹及每一条所述子指纹在所述第一音频指纹中对应的位置存储到所述子指纹表中,包括:判断...
【专利技术属性】
技术研发人员:景晓军,张文文,张楠,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。