【技术实现步骤摘要】
音频广告检测方法、系统、移动终端及存储介质
本专利技术属于音频检测
,尤其涉及一种音频广告检测方法、系统、移动终端及存储介质。
技术介绍
随着互联网的发展与普及,互联网上积累了大量的信息,其中包括大量语音类的音频信息。而在这些语音类的音频信息中,很多会带有广告。当用户进行音频点播时,带有广告的音频会很大程度上影响用户的点播体验。例如,在故事机产品中,其核心功能就是根据用户的语音点播返回指定的故事音频。故事机的故事音频数据库共有数千个专辑,包含了数十万的音频。但是,音频的质量参差不齐,其中还有大量的音频包含着第三方的广告信息。如果用户使用故事机进行点播的时候,给用户播放了这类“低质量”的带广告的故事资源,势必会给用户造成不好的点播体验。因此,如何能够在数据入库的时候,快速的筛选出带有广告的音频,是大家十分关注的问题。现有的音频广告检测方法采用的是基于音频指纹的模板匹配,工作人员通过听取音频数据,人工的截取广告段并将广告段以音频指纹的形式存入到数据库中,在对音频数据进行广告检测任务时,通过对广播音频进行音频指纹的提 ...
【技术保护点】
1.一种音频广告检测方法,其特征在于,所述方法包括:/n获取音频数据,并对所述音频数据进行特征提取,以得到音频特征;/n对所述音频特征进行矩阵计算,以得到自相似矩阵;/n将所述自相似矩阵中的最大峰值点设置为相似段基准点,并根据所述相似段基准点在所述自相似矩阵中进行相似点查询;/n根据查询结果将查询到的所述相似点的集合设置为广告段,并根据所述广告段对所述音频数据进行广告剔除处理。/n
【技术特征摘要】
1.一种音频广告检测方法,其特征在于,所述方法包括:
获取音频数据,并对所述音频数据进行特征提取,以得到音频特征;
对所述音频特征进行矩阵计算,以得到自相似矩阵;
将所述自相似矩阵中的最大峰值点设置为相似段基准点,并根据所述相似段基准点在所述自相似矩阵中进行相似点查询;
根据查询结果将查询到的所述相似点的集合设置为广告段,并根据所述广告段对所述音频数据进行广告剔除处理。
2.如权利要求1所述的音频广告检测方法,其特征在于,所述根据所述相似段基准点在所述自相似矩阵中进行相似点查询步骤包括:
将所述相似段基准点设置为中点,并沿所述自相似矩阵的对角线进行等距延伸,以得到起点位置和终点位置;
计算所述起点位置与所述终点位置之间的相似度,以得到相似值;
判断所述相似值是否小于相似阈值;
当判断到所述相似值小于所述相似阈值时,停止所述起点位置和所述终点位置的延伸;
将所述起点位置和所述终点位置之间的点设置为所述相似点。
3.如权利要求1所述的音频广告检测方法,其特征在于,所述根据所述广告段对所述音频数据进行广告剔除处理的步骤之后,所述方法还包括:
对所述音频数据中的音频信号进行特征计算,以得到音频特征向量;
将所述特征向量输入梯度提升树模型,并控制所述梯度提升树模型对所述音频数据的所有音频帧进行分类;
当判断到所述音频帧的分类结果为广告分类时,对所述音频帧标记为广告帧,并将所述音频信号中连续的所述广告帧进行删除。
4.如权利要求3所述的音频广告检测方法,其特征在于,所述对所述音频数据中的音频信号进行特征计算的步骤包括:
对所述音频信号进行分帧加窗处理,并提取MFCC特征、过零率特征、短时能量特征、能量熵特征、频谱中心特征、频谱延展度特征和频谱通量特征;
将所述MFCC特征、所述过零率特征、所述短时能量特征、所述能量熵特征、所述频谱中心特征、所述频谱延展度...
【专利技术属性】
技术研发人员:陈剑超,肖龙源,李稀敏,蔡振华,刘晓葳,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。