POP音检测方法、装置、终端设备及存储介质制造方法及图纸

技术编号:28298215 阅读:38 留言:0更新日期:2021-04-30 16:24
本申请公开了一种POP音检测方法、装置、终端设备及存储介质,该方法包括:通过获取待检测的音频数据;对所述待检测的音频数据进行滤波处理,能够过滤部分正常跳变信号成分,得到滤波处理后的数据;基于所述滤波处理后的数据构造检测信号;将所述检测信号与预设检测阈值进行比较;若所述检测信号大于预设检测阈值,则判定检测到POP音。该方案能够实现音频数据中POP音的精准检测,避免出现漏判情况,通过实时POP音检测能够定位POP音出现的位置,为POP音修复提供辅助参考,而且计算量较小。

【技术实现步骤摘要】
POP音检测方法、装置、终端设备及存储介质
本申请涉及多媒体
,尤其涉及一种POP音检测方法、装置、终端设备及存储介质。
技术介绍
在音频播放过程中,有时会产生POP音,POP音是一种不正常破音,产生POP音的原因很多,比如录音时外界环境声音的影响,录音停止时按下停止键的按键声音被录入进音频文件等,这些都会导致产生POP音,POP音会影响用户播放音频的体验。目前,在检测POP音时,通常采用的方案是,将选定的音频数据的音频幅值与阈值进行比较,若选定的音频数据的音频幅值小于阈值,则表明选定的音频数据可能存在POP音数据。由于POP音出现的原因种类较多,该相关技术方案并不能适应各种类型的POP音检测。而且仅利用音频的幅值进行POP音检测判定,只适用于声音音量突然增大的场景,而在数据跳变的情况下,也会出现POP音,这种场景音频的幅值不一定会高于阈值。因此,现有相关方案对POP音的检测较简单,容易出现漏判情况。
技术实现思路
本申请的主要目的在于提供一种POP音检测方法、装置、终端设备及存储介质,旨在实现音频数据中POP音的精准检测,避免出现漏判情况。为实现上述目的,本申请实施例提供一种POP音检测方法,所述POP音检测方法包括以下步骤:获取待检测的音频数据;对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据;基于所述滤波处理后的数据构造检测信号;将所述检测信号与预设检测阈值进行比较;若所述检测信号大于预设检测阈值,则判定检测到POP音r>此外,本申请实施例还提出一种POP音检测装置,所述POP音检测装置包括:获取模块,用于获取待检测的音频数据;滤波模块,用于对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据;构造模块,用于基于所述滤波处理后的数据构造检测信号;比较模块,用于将所述检测信号与预设检测阈值进行比较;判定模块,用于若所述检测信号大于预设检测阈值,则判定检测到POP音。此外,本申请实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的POP音检测程序,所述POP音检测程序被所述处理器执行时实现如上所述的POP音检测方法的步骤。此外,本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有POP音检测程序,所述POP音检测程序被处理器执行时实现如上所述的POP音检测方法的步骤。本申请实施例提出的POP音检测方法、装置、终端设备及存储介质,通过获取待检测的音频数据;对所述待检测的音频数据进行滤波处理,能够过滤部分正常跳变信号成分,得到滤波处理后的数据;基于所述滤波处理后的数据构造检测信号;将所述检测信号与预设检测阈值进行比较;若所述检测信号大于预设检测阈值,则判定检测到POP音。该方案能够实现音频数据中POP音的精准检测,避免出现漏判情况,通过实时POP音检测能够定位POP音出现的位置,为POP音修复提供辅助参考,而且计算量较小;POP音检测结果,方便开发人员进行定位、分析,提升工作效率。附图说明图1为本申请POP音检测装置所属终端设备的功能模块示意图;图2为本申请POP音检测方法一示例性实施例的流程示意图;图3为本实施例涉及的音频数据进行高通滤波前的效果图;图4为本实施例涉及的音频数据进行高通滤波后的效果图;图5为本申请POP音检测方法另一示例性实施例的流程示意图;图6为本申请实施例中对音频数据进行重叠分帧的波形示意图;图7为本申请POP音检测方法再一示例性实施例的流程示意图;图8为本申请POP音检测方法实施例的一种细化流程示意图;图9为本申请POP音检测方法实施例的另一种细化流程示意图;图10为本申请POP音检测方法实施例的再一种细化流程示意图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例的主要解决方案是:通过获取待检测的音频数据;对所述待检测的音频数据进行滤波处理,能够过滤部分正常跳变信号成分,得到滤波处理后的数据;基于所述滤波处理后的数据构造检测信号;将所述检测信号与预设检测阈值进行比较;若所述检测信号大于预设检测阈值,则判定检测到POP音。该方案能够实现音频数据中POP音的精准检测,避免出现漏判情况,通过实时POP音检测能够定位POP音出现的位置,为POP音修复提供辅助参考,而且计算量较小;POP音检测结果,可以方便开发人员进行定位、分析,提升工作效率。本申请实施例考虑到,现有相关方案中,在检测POP音时,通常将选定的音频数据的音频幅值与阈值进行比较,若选定的音频数据的音频幅值小于阈值,则表明选定的音频数据可能存在POP音数据。由于POP音出现的原因种类较多,该相关技术方案并不能适应各种类型的POP音检测。而且仅利用音频的幅值进行POP音检测判定,只适用于声音音量突然增大的场景,而在数据跳变的情况下,也会出现POP音,这种场景音频的幅值不一定会高于阈值。因此,现有相关方案对POP音的检测较简单,容易出现漏判情况。因此,本申请实施例提出解决方案,可以实现音频数据中POP音的精准检测,避免出现漏判情况。具体地,参照图1,图1为本申请POP音检测装置所属终端设备的功能模块示意图。该POP音检测装置可以为独立于终端设备的、能够实现音频检测的装置,其可以通过硬件或软件的形式承载于终端设备上。该终端设备可以为手机、平板电脑等智能移动终端,还可以为其他能够播放音频文件的音频播放设备。在本实施例中,该POP音检测装置所属终端设备至少包括输出模块110、处理器120、存储器130以及通信模块140。存储器130中存储有操作系统以及POP音检测程序,POP音检测装置可以将获取的待检测的音频数据、滤波处理后的数据、构造的检测信号等信息存储于该存储器130中;输出模块110可为显示屏、扬声器等。通信模块140可以包括WIFI模块、移动通信模块以及蓝牙模块等,通过通信模块140与外部设备或服务器进行通信。其中,作为一种实施例方式,存储器130中的POP音检测程序被处理器执行时实现以下步骤:获取待检测的音频数据;对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据;基于所述滤波处理后的数据构造检测信号;将所述检测信号与预设检测阈值进行比较;若所述检测信号大于预设检测阈值,则判定检测到POP音。进一步地,存储器130中的POP音检测程序被处理器执行时还实现以下步骤:获取所述待检测的音频数据的采样率;根据所述采样率确定通带截止频率;根据所述通带截止频率对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据。进一步地,存储器130中的POP音检测程序被处理器执行时还实现以下本文档来自技高网...

【技术保护点】
1.一种POP音检测方法,其特征在于,所述POP音检测方法包括以下步骤:/n获取待检测的音频数据;/n对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据;/n基于所述滤波处理后的数据构造检测信号;/n将所述检测信号与预设检测阈值进行比较;/n若所述检测信号大于预设检测阈值,则判定检测到POP音。/n

【技术特征摘要】
1.一种POP音检测方法,其特征在于,所述POP音检测方法包括以下步骤:
获取待检测的音频数据;
对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据;
基于所述滤波处理后的数据构造检测信号;
将所述检测信号与预设检测阈值进行比较;
若所述检测信号大于预设检测阈值,则判定检测到POP音。


2.根据权利要求1所述的POP音检测方法,其特征在于,所述对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据包括:
获取所述待检测的音频数据的采样率;
根据所述采样率确定通带截止频率;
根据所述通带截止频率对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据。


3.根据权利要求1所述的POP音检测方法,其特征在于,所述基于所述滤波处理后的数据构造检测信号的步骤包括:
获取所述滤波处理后的数据的相邻帧能量差值;
基于所述滤波处理后的数据的相邻帧能量差值生成检测信号。


4.根据权利要求1所述的POP音检测方法,其特征在于,所述基于所述滤波处理后的数据构造检测信号的步骤包括:
计算所述滤波处理后的数据的高阶导数;
基于所述滤波处理后的数据的高阶导数生成检测信号。


5.根据权利要求4所述的POP音检测方法,其特征在于,所述将所述检测信号与预设检测阈值进行比较的步骤之前还包括:
获取所述待检测的音频数据的采样间隔;
基于所述采样间隔、所述滤波处理后的数据及预设检测阈值构造公式,构造检测阈值。


6.根据权利要求1-5中任一项所述的POP音检测方法,其特征在于,所述对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据的步骤之前还包括:
对所述待检测的音频数据进行重叠分帧处理;
所述对所述待检测的音频数据进行滤波处理,得到滤波处理后的数据的步骤包括:
对重叠分帧处理后的音频数据进行滤波处理,得到滤波处理后的数据。


7.根据权利要求6所述的POP音检测方法,其特征在于,所述对所述待检测的音频数据进行重叠分帧处理的步骤之后还包括:
对重叠分帧处理后的音频数据...

【专利技术属性】
技术研发人员:王艳芬严锋贵
申请(专利权)人:OPPO重庆智能科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1