一种音频响度异常检测方法、设备及存储介质技术

技术编号：36552379 阅读：18 留言：0更新日期：2023-02-04 17:06

本申请公开了一种音频响度异常检测方法、设备及存储介质，涉及音频检测技术领域。该方法包括：获取待检测音频，按照预设时间长度对所述待检测音频进行分割，得到多个音频片段；计算每个所述音频片段对应的音频响度值，从所有所述音频响度值中筛选出目标音频响度值，并将所述目标音频响度值对应的音频片段作为目标音频片段；根据所述目标音频片段与所述目标音频片段左侧的音频片段之间的音频响度差异，以及所述目标音频片段与所述目标音频片段右侧的音频片段之间的音频响度差异，判断所述待检测音频是否存在响度异常。实现自动化的对音频文件进行响度异常检测，及时从海量音频文件中发现存在响度异常的音频文件。中发现存在响度异常的音频文件。中发现存在响度异常的音频文件。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频响度异常检测方法、设备及存储介质

[0001]本专利技术涉及音频检测
，特别涉及一种音频响度异常检测方法、设备及存储介质。

技术介绍

[0002]音频文件中可能存在响度忽大忽小的情况，导致整个作品响度听起来不一致，用户体验差。例如，在一些播客节目中，经常有一些固定的音频片头、片中、片尾，比如“欢迎来到某某有声书平台，我是主持人某某”，“今天的节目到此结束，欢迎收听下一期节目，谢谢大家，再见！”等等。因为这些都是固定的，因此一般只录制一遍后保存，每次主播只要录制正文，然后将固定的片头、片尾等，插入到正文需要的位置，即可完成作品的制作；有些有声书朗读，比如网文，篇章较多，甚至达上千章，因此通过自动化的处理片段片尾也很常见。现实上，由于有些主播对音频编辑的专业性不足、或者考虑不周、或者自动化处理时，未考虑固定片头、片中、片尾等音频片段的响度，与拼接前后正文的音频响度的关系，从而导致，片头、片尾的声音，存在过大、过小的可能，如片头的声音明显比正文的声音要大，或片头的声音明显比正文的声音要小，因此导致整个作品响度听起来不一致。综上，在实现本专利技术的过程中，专利技术人至少发现现有技术中存在音频文件中响度忽大忽小不一致的问题。

技术实现思路

[0003]有鉴于此，本专利技术的目的在于提供一种音频响度异常检测方法、设备及介质，能够实现自动化的对音频文件进行响度异常检测，及时从海量音频文件中发现存在响度异常的音频文件。其具体方案如下：
[0004]第一方面，本申请公开了一种音频响度异常检测方法，...

【技术保护点】

【技术特征摘要】
1.一种音频响度异常检测方法，其特征在于，包括：获取待检测音频，按照预设时间长度对所述待检测音频进行分割，得到多个音频片段；计算每个所述音频片段对应的音频响度值，从所有所述音频响度值中筛选出目标音频响度值，并将所述目标音频响度值对应的音频片段作为目标音频片段；根据所述目标音频片段与所述目标音频片段左侧的音频片段之间的音频响度差异，以及所述目标音频片段与所述目标音频片段右侧的音频片段之间的音频响度差异，判断所述待检测音频是否存在响度异常。2.根据权利要求1所述的音频响度异常检测方法，其特征在于，所述根据所述目标音频片段与所述目标音频片段左侧的音频片段之间的音频响度差异，以及所述目标音频片段与所述目标音频片段右侧的音频片段之间的音频响度差异，判断所述待检测音频是否存在响度异常，包括：按照目标音频集合生成规则，生成以所述目标音频片段为锚点的目标音频集合；选取与所述目标音频集合左侧相邻的连续预设数量的音频片段作为第一音频片段集合，选取与所述目标音频集合右侧相邻的连续预设数量的音频片段作为第二音频片段集合；根据所述目标音频集合与所述第一音频片段集合之间的音频响度差异，以及所述目标音频集合与所述第二音频片段集合之间的音频响度差异，判断所述目标音频片段所在的音频片段大集合内是否存在响度异常，并根据音频片段大集合的判断结果判定所述待检测音频是否存在响度异常。3.根据权利要求2所述的音频响度异常检测方法，其特征在于，所述按照目标音频集合生成规则，生成以所述目标音频片段为锚点的目标音频集合之前，还包括：从所有所述音频响度值中筛选出最大音频响度值和最小音频响度值，并计算所述最大音频响度值与所述最小音频响度值的差值；若所述差值小于第一预设阈值，则判定所述待检测音频不存在响度异常；若所述差值大于或等于所述第一预设阈值，则执行所述按照目标音频集合生成规则，以所述目标音频片段为锚点生成对应的目标音频集合的操作。4.根据权利要求2所述的音频响度异常检测方法，其特征在于，所述按照目标音频集合生成规则，生成以所述目标音频片段为锚点的目标音频集合，包括：以所述目标音频片段左侧相邻的音频片段为首个音频片段，向左依次计算每个音频片段与所述目标音频片段的响度差值，并将所述响度差值小于第二预设阈值的音频片段作为待选片段，直至出现首个响度差值大于或等于所述第二预设阈值的音频片段后停止计...

【专利技术属性】
技术研发人员：陈洲旋，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人