一种音频检测方法、装置和存储介质制造方法及图纸

技术编号：25273992 阅读：20 留言：0更新日期：2020-08-14 23:06

本发明专利技术实施例公开了一种音频检测方法、装置和存储介质，其中，本发明专利技术通过在接收到音频检测请求时，获取待检测音频，并对待检测音频做分帧处理，得到多个音频帧，以及获取每一音频帧的信号功率，得到时域维度上的信号功率序列，然后根据该时域维度上的信号功率序列从多个音频帧中确定出发音音频帧。相较于相关技术，本发明专利技术无需大量前期处理，也无需大量的实时处理，只需要简单的对待检测音频进行分帧后，利用对应的信号功率序列即可预测出其中的发音音频帧，也即是待检测音频的发音位置。由此，本发明专利技术能够高效且低消耗的完成对音频发声位置的检测。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频检测方法、装置和存储介质
本专利技术涉及音频处理
，具体涉及一种音频检测方法、装置和存储介质。
技术介绍
随着互联网的普及，以及数字音频的迅速流行，用户可以通过手机、平板电脑等电子设备播放数字音频(比如有声小说、歌曲等)。为了能够更好地播放数字音频，相关技术中对数字音频的发音位置进行检测，比如，基于自动语音识别的发音位置识别技术，基于节拍检测的发音位置识别技术等。在对现有技术的研究和实践过程中，本专利技术的专利技术人发现，现有技术在识别音频的发音位置时，不是需要大量的前期处理，就是需要大量的实时处理，导致大量处理资源的消耗。
技术实现思路
本专利技术实施例提供一种音频检测方法、装置和存储介质，能够高效且低消耗的完成对音频发声位置的检测。本专利技术实施例提供的音频检测方法，包括：当接收到音频检测请求时，获取待检测音频；对所述待检测音频做分帧处理，得到多个音频帧；获取每一音频帧的信号功率，得到时域维度上的信号功率序列；根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧。本专利技术实施例还提供一种音频检测装置，包括：音频获取模块，用于当接收音频检测请求时，获取待检测音频；音频分帧模块，用于对所述待检测音频做分帧处理，得到多个音频帧；功率获取模块，用于获取每一音频帧的信号功率，得到时域维度上的信号功率序列；音频识别模块，用于根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发...

【技术保护点】
1.一种音频检测方法，其特征在于，所述音频检测方法包括：/n当接收到音频检测请求时，获取待检测音频；/n对所述待检测音频做分帧处理，得到多个音频帧；/n获取每一音频帧的信号功率，得到时域维度上的信号功率序列；/n根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧。/n

【技术特征摘要】
1.一种音频检测方法，其特征在于，所述音频检测方法包括：
当接收到音频检测请求时，获取待检测音频；
对所述待检测音频做分帧处理，得到多个音频帧；
获取每一音频帧的信号功率，得到时域维度上的信号功率序列；
根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧。

2.根据权利要求1所述的音频检测方法，其特征在于，所述根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧的步骤，包括：
对所述时域维度上的信号功率序列做平滑处理，得到平滑后的信号功率序列；
对所述平滑后的信号功率序列做差分处理，得到差分序列；
根据所述差分序列从所述多个音频帧中确定出所述发音音频帧。

3.根据权利要求2所述的音频检测方法，其特征在于，所述根据所述差分序列从所述多个音频帧中确定出所述发音音频帧的步骤，包括：
通过指数映射的方式对所述差分序列做归一化处理，得到归一化后的差分序列；
将所述归一化后的差分序列中，自身对应的值大于预设阈值以及前一音频帧对应的值小于所述预设阈值的音频帧，设为所述发音音频帧。

4.根据权利要求2所述的音频检测方法，其特征在于，所述对所述信号功率序列做平滑处理，得到平滑后的信号功率序列的步骤，包括：
获取预设的平滑函数；
根据所述平滑函数对所述信号功率序列做卷积运算，得到所述平滑后的信号功率序列。

5.根据权利要求1所述的音频检测方法，其特征在于，所述获取每一音频帧的信号功率的步骤，包括：
获取所述待检测音频的采样频率，根据所述采样频率确定所述音频帧中的采样点；
获取每一采样点的幅值，并确定出所有幅值的中值；
将所述中值的平方值设为所述音频...

【专利技术属性】
技术研发人员：张超鹏，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人