本发明专利技术提供了一种音频广告检测方法、系统、移动终端及存储介质,该方法包括:获取音频数据进行特征提取,得到音频特征;对音频特征进行矩阵计算,得到自相似矩阵;将自相似矩阵中的最大峰值点设置为相似段基准点,根据相似段基准点在自相似矩阵中进行相似点查询;根据查询结果将查询到的相似点的集合设置为广告段,根据广告段对音频数据进行广告剔除处理。本发明专利技术通过对音频特征进行自相似矩阵的计算设计,能有效的进行相似段基准点的设置,基于相似段基准点的设置,以自动进行相似点的查询,并基于相似点的查询结果进行广告段的获取和剔除,本发明专利技术实施例无需采用人工手动的方式进行广告音频指纹的标记和比对,提高了音频广告检测的检测效率。
Audio advertisement detection method, system, mobile terminal and storage medium
【技术实现步骤摘要】
音频广告检测方法、系统、移动终端及存储介质
本专利技术属于音频检测
,尤其涉及一种音频广告检测方法、系统、移动终端及存储介质。
技术介绍
随着互联网的发展与普及,互联网上积累了大量的信息,其中包括大量语音类的音频信息。而在这些语音类的音频信息中,很多会带有广告。当用户进行音频点播时,带有广告的音频会很大程度上影响用户的点播体验。例如,在故事机产品中,其核心功能就是根据用户的语音点播返回指定的故事音频。故事机的故事音频数据库共有数千个专辑,包含了数十万的音频。但是,音频的质量参差不齐,其中还有大量的音频包含着第三方的广告信息。如果用户使用故事机进行点播的时候,给用户播放了这类“低质量”的带广告的故事资源,势必会给用户造成不好的点播体验。因此,如何能够在数据入库的时候,快速的筛选出带有广告的音频,是大家十分关注的问题。现有的音频广告检测方法采用的是基于音频指纹的模板匹配,工作人员通过听取音频数据,人工的截取广告段并将广告段以音频指纹的形式存入到数据库中,在对音频数据进行广告检测任务时,通过对广播音频进行音频指纹的提取操作,并将提取到的音频指纹与数据库中音频指纹进行逐一对比。如果音频指纹匹配成功,则被检测音频段为广告段且广告的具体信息也可以被确定。如果指纹匹配失败,则说明被检测音频并不属于已被录入音频指纹数据库中的广告。由于音频数据中广告的种类数目繁多,工作人员构建的音频指纹库往往也变成巨大。在对音频数据进行广告检测时,每一段待检测音频都需要对指纹库中的每一个音频指纹进行对比,进而导致音频广告检测的检测效率低下。
技术实现思路
本专利技术实施例的目的在于提供一种音频广告检测方法、系统、移动终端及存储介质,旨在解决现有的音频广告检测方法训练效率低下且耗时长的问题。本专利技术实施例是这样实现的,一种音频广告检测方法,所述方法包括:获取音频数据,并对所述音频数据进行特征提取,以得到音频特征;对所述音频特征进行矩阵计算,以得到自相似矩阵;将所述自相似矩阵中的最大峰值点设置为相似段基准点,并根据所述相似段基准点在所述自相似矩阵中进行相似点查询;根据查询结果将查询到的所述相似点的集合设置为广告段,并根据所述广告段对所述音频数据进行广告剔除处理。更进一步的,所述根据所述相似段基准点在所述自相似矩阵中进行相似点查询步骤包括:将所述相似段基准点设置为中点,并沿所述自相似矩阵的对角线进行等距延伸,以得到起点位置和终点位置;计算所述起点位置与所述终点位置之间的相似度,以得到相似值;判断所述相似值是否小于相似阈值;当判断到所述相似值小于所述相似阈值时,停止所述起点位置和所述终点位置的延伸;将所述起点位置和所述终点位置之间的点设置为所述相似点。更进一步的,所述根据所述广告段对所述音频数据进行广告剔除处理的步骤之后,所述方法还包括:对所述音频数据中的音频信号进行特征计算,以得到音频特征向量;将所述特征向量输入梯度提升树模型,并控制所述梯度提升树模型对所述音频数据的所有音频帧进行分类;当判断到所述音频帧的分类结果为广告分类时,对所述音频帧标记为广告帧,并将所述音频信号中连续的所述广告帧进行删除。更进一步的,所述对所述音频数据中的音频信号进行特征计算的步骤包括:对所述音频信号进行分帧加窗处理,并提取MFCC特征、过零率特征、短时能量特征、能量熵特征、频谱中心特征、频谱延展度特征和频谱通量特征;将所述MFCC特征、所述过零率特征、所述短时能量特征、所述能量熵特征、所述频谱中心特征、所述频谱延展度特征和所述频谱通量特征进行向量拼接,以得到所述音频特征向量。更进一步的,所述对所述音频特征进行矩阵计算的步骤包括:对所述音频特征进行余弦计算,以得到余弦相似度;根据所述余弦相似度查询目标距离公式,并根据所述目标距离公式对所述音频特征进行矩阵计算。更进一步的,所述将所述自相似矩阵中的最大峰值点设置为相似段基准点的步骤之前,所述方法还包括:对所述自相似矩阵进行卷积处理,以删除所述自相似矩阵中的异常点。更进一步的,所述对所述音频数据进行特征提取的步骤之后,所述方法还包括:对所述音频特征进行分类,并根据分类结果进行音频分割,以得到多组不同类别的所述音频特征;依序对不同类别的所述音频特征进行矩阵计算。本专利技术实施例的另一目的在于提供一种音频广告检测系统,所述系统包括:特征提取模块,用于获取音频数据,并对所述音频数据进行特征提取,以得到音频特征;矩阵计算模块,用于对所述音频特征进行矩阵计算,以得到自相似矩阵;相似点查询模块,用于将所述自相似矩阵中的最大峰值点设置为相似段基准点,并根据所述相似段基准点在所述自相似矩阵中进行相似点查询;广告剔除模块,用于根据查询结果将查询到的所述相似点的集合设置为广告段,并根据所述广告段对所述音频数据进行广告剔除处理。本专利技术实施例的另一目的在于提供一种移动终端,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述移动终端执行上述的音频广告检测方法。本专利技术实施例的另一目的在于提供一种存储介质,其存储有上述的移动终端中所使用的计算机程序,该计算机程序被处理器执行时实现上述的音频广告检测方法的步骤。本专利技术实施例,通过对音频特征进行自相似矩阵的计算设计,能有效的进行相似段基准点的设置,基于相似段基准点的设置,以自动进行相似点的查询,并基于相似点的查询结果进行广告段的获取和剔除,本专利技术实施例无需采用人工手动的方式进行广告音频指纹的标记和比对,进而有效的提高了音频广告检测的检测效率。附图说明图1是本专利技术第一实施例提供的音频广告检测方法的流程图;图2是本专利技术第二实施例提供的音频广告检测方法的流程图;图3是本专利技术第三实施例提供的音频广告检测方法的流程图;图4是本专利技术第四实施例提供的音频广告检测系统的结构示意图;图5是本专利技术第五实施例提供的移动终端的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。实施例一请参阅图1,是本专利技术第一实施例提供的音频广告检测方法的流程图,包括步骤:步骤S10,获取音频数据,并对所述音频数据进行特征提取,以得到音频特征;其中,所述对所述音频数据进行特征提取的步骤包括:对所述音频数据进行预处理,完成该预处理后对音频特征进行静音帧判断,当判断到该音频特征所对应的音频为静音帧时,判定该音频数据的类型为静音音频;当判断到该音频特征所对应的音频不为静音帧时,将该音频特征输入分类器进行分类,以判定对应音频数据的类型本文档来自技高网...
【技术保护点】
1.一种音频广告检测方法,其特征在于,所述方法包括:/n获取音频数据,并对所述音频数据进行特征提取,以得到音频特征;/n对所述音频特征进行矩阵计算,以得到自相似矩阵;/n将所述自相似矩阵中的最大峰值点设置为相似段基准点,并根据所述相似段基准点在所述自相似矩阵中进行相似点查询;/n根据查询结果将查询到的所述相似点的集合设置为广告段,并根据所述广告段对所述音频数据进行广告剔除处理。/n
【技术特征摘要】
1.一种音频广告检测方法,其特征在于,所述方法包括:
获取音频数据,并对所述音频数据进行特征提取,以得到音频特征;
对所述音频特征进行矩阵计算,以得到自相似矩阵;
将所述自相似矩阵中的最大峰值点设置为相似段基准点,并根据所述相似段基准点在所述自相似矩阵中进行相似点查询;
根据查询结果将查询到的所述相似点的集合设置为广告段,并根据所述广告段对所述音频数据进行广告剔除处理。
2.如权利要求1所述的音频广告检测方法,其特征在于,所述根据所述相似段基准点在所述自相似矩阵中进行相似点查询步骤包括:
将所述相似段基准点设置为中点,并沿所述自相似矩阵的对角线进行等距延伸,以得到起点位置和终点位置;
计算所述起点位置与所述终点位置之间的相似度,以得到相似值;
判断所述相似值是否小于相似阈值;
当判断到所述相似值小于所述相似阈值时,停止所述起点位置和所述终点位置的延伸;
将所述起点位置和所述终点位置之间的点设置为所述相似点。
3.如权利要求1所述的音频广告检测方法,其特征在于,所述根据所述广告段对所述音频数据进行广告剔除处理的步骤之后,所述方法还包括:
对所述音频数据中的音频信号进行特征计算,以得到音频特征向量;
将所述特征向量输入梯度提升树模型,并控制所述梯度提升树模型对所述音频数据的所有音频帧进行分类;
当判断到所述音频帧的分类结果为广告分类时,对所述音频帧标记为广告帧,并将所述音频信号中连续的所述广告帧进行删除。
4.如权利要求3所述的音频广告检测方法,其特征在于,所述对所述音频数据中的音频信号进行特征计算的步骤包括:
对所述音频信号进行分帧加窗处理,并提取MFCC特征、过零率特征、短时能量特征、能量熵特征、频谱中心特征、频谱延展度特征和频谱通量特征;
将所述MFCC特征、所述过零率特征、所述短时能量特征、所述能量熵特征、所述频谱中心特征、所述频谱延展度...
【专利技术属性】
技术研发人员:陈剑超,肖龙源,李稀敏,蔡振华,刘晓葳,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。