【技术实现步骤摘要】
破音检测方法和装置、电子设备、存储介质
[0001]本公开涉及信号处理
,更具体地,本公开的实施方式涉及一种破音检测方法和装置、电子设备、存储介质。
技术介绍
[0002]本部分旨在为陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]破音又称为爆音,是一种很刺耳的声音,在存在破音的情况下,原本的声音会变得含混不清。当音频信号中存在破音时会严重影响音频质量,因此,需要对音频信号进行破音检测。
[0004]由于绝大多数破音是由信号削波导致的,相关技术中,通常是通过一个削波阈值来检测削波,再通过削波来判断破音的。但实际上,削波并不一定会产生听感破音,这样就容易出现误检;且对于信号波动较大场景,采用固定的削波阈值进行检测的准确率较低。
技术实现思路
[0005]本公开的实施方式提供一种破音检测方法和装置、电子设备、存储介质。
[0006]在本公开实施方式的第一方面中,提供了一种破音检测方法,方法包括:将待检测音频信号划分为N个时域信号帧 ...
【技术保护点】
【技术特征摘要】
1.一种破音检测方法,其特征在于,所述方法包括:将待检测音频信号划分为N个时域信号帧,所述N为正整数;根据每帧时域信号帧内信号幅值的统计分布情况,确定该帧对应的第一削波置信度,所述第一削波置信度用于区分正常音频信号和削波音频信号;根据连续M个时域信号帧的第一削波置信度,确定由连续M个时域信号帧形成的检测窗对应的第二削波置信度;所述M为小于所述N的正整数;响应于所述第二削波置信度大于预设第一阈值,确定对应的检测窗内存在破音。2.根据权利要求1所述的方法,其特征在于,所述根据每帧时域信号帧内信号幅值的统计分布情况,确定第一削波置信度,包括:对于每帧时域信号帧,统计各幅值区段内的信号数量,以构建统计直方图;所述幅值区段为对由该时域信号帧的最大幅值与最小幅值形成的幅值区间进行划分获得的;查找所述统计直方图中的目标区块,所述目标区块为区块两端均高于区块中间,且区块后端高于区块前端的区块,区块前端和区块后端为根据所述查找的先后顺序确定的;确定各所述目标区块中区块两端的横向距离;根据各所述横向距离中的最大值与所述幅值区段的总数量的比值,确定所述第一削波置信度。3.根据权利要求2所述的方法,其特征在于,所述查找所述目标区块,包括:分别从所述统计直方图的两端开始,依次向中间移动,查找所述目标区块。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:对于每帧时域信号帧,根据目标信号在该帧时域信号帧中的占比,确定该帧的第一削波比例,所述目标信号为幅值最大值和幅值最小值对应的信号;根据连续M个时域信号帧的第一削波比例,确定对应检测窗的第二削波比例;所述确定检测窗内存在破音,包括:响应于所述第二削波置信度大于预设第一阈值,且所述第二削波比例大于预设第二阈值,确定该检测窗内存在破音。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:确定该检测窗内时域信号帧的频域能量特征;所述确定检测窗内存在破音,包括:响应于检测窗内信号帧不满足以下至少一项:所述第二削波置信度大于预设第...
【专利技术属性】
技术研发人员:包绎成,林勇平,熊贝尔,刘华平,赵翔宇,
申请(专利权)人:杭州网易云音乐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。