一种音频检测方法、装置和存储介质制造方法及图纸

技术编号:25273992 阅读:20 留言:0更新日期:2020-08-14 23:06
本发明专利技术实施例公开了一种音频检测方法、装置和存储介质,其中,本发明专利技术通过在接收到音频检测请求时,获取待检测音频,并对待检测音频做分帧处理,得到多个音频帧,以及获取每一音频帧的信号功率,得到时域维度上的信号功率序列,然后根据该时域维度上的信号功率序列从多个音频帧中确定出发音音频帧。相较于相关技术,本发明专利技术无需大量前期处理,也无需大量的实时处理,只需要简单的对待检测音频进行分帧后,利用对应的信号功率序列即可预测出其中的发音音频帧,也即是待检测音频的发音位置。由此,本发明专利技术能够高效且低消耗的完成对音频发声位置的检测。

【技术实现步骤摘要】
一种音频检测方法、装置和存储介质
本专利技术涉及音频处理
,具体涉及一种音频检测方法、装置和存储介质。
技术介绍
随着互联网的普及,以及数字音频的迅速流行,用户可以通过手机、平板电脑等电子设备播放数字音频(比如有声小说、歌曲等)。为了能够更好地播放数字音频,相关技术中对数字音频的发音位置进行检测,比如,基于自动语音识别的发音位置识别技术,基于节拍检测的发音位置识别技术等。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,现有技术在识别音频的发音位置时,不是需要大量的前期处理,就是需要大量的实时处理,导致大量处理资源的消耗。
技术实现思路
本专利技术实施例提供一种音频检测方法、装置和存储介质,能够高效且低消耗的完成对音频发声位置的检测。本专利技术实施例提供的音频检测方法,包括:当接收到音频检测请求时,获取待检测音频;对所述待检测音频做分帧处理,得到多个音频帧;获取每一音频帧的信号功率,得到时域维度上的信号功率序列;根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧。本专利技术实施例还提供一种音频检测装置,包括:音频获取模块,用于当接收音频检测请求时,获取待检测音频;音频分帧模块,用于对所述待检测音频做分帧处理,得到多个音频帧;功率获取模块,用于获取每一音频帧的信号功率,得到时域维度上的信号功率序列;音频识别模块,用于根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧。此外,本专利技术实施例还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行本专利技术实施例所提供的音频检测方法。本专利技术通过在接收到音频检测请求时,获取待检测音频,并对待检测音频做分帧处理,得到多个音频帧,以及获取每一音频帧的信号功率,得到时域维度上的信号功率序列,然后根据该时域维度上的信号功率序列从多个音频帧中确定出发音音频帧。相较于相关技术,本专利技术无需大量前期处理,也无需大量的实时处理,只需要简单的对待检测音频进行分帧后,利用对应的信号功率序列即可预测出其中的发音音频帧,也即是待检测音频的发音位置。由此,本专利技术能够高效且低消耗的完成对音频发声位置的检测。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a是本专利技术实施例提供的音频检测方法的一流程示意图;图1b是本专利技术实施例中音频检测界面的示例图;图1c是本专利技术实施例中选择子界面的示例图;图1d是本专利技术实施例中对待检测音频做分帧处理的示意图;图2a是本专利技术实施例提供的音频检测方法的另一流程示意图;图2b是本专利技术实施例中人工标记的歌词发声时间点的示意图;图2c是本专利技术实施例中进行音频检测的过程曲线示意图;图2d为采用本专利技术提供的音频检测方法所实际检测出的歌词发声位置的示意图;图2e为采用本专利技术提供的音频检测方法对包括伴奏的歌曲音频所实际检测出的歌词发声位置的示意图;图3是本专利技术实施例提供的音频检测装置的结构示意图;图4是本专利技术实施例提供的检测设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种音频检测方法、装置和存储介质。其中,该音频检测方法可由音频检测装置执行,该音频检测装置可以集成在如用户终端(比如,手机、平板电脑等)、网络设备等检测设备,使得检测设备在接收到音频检测请求时,获取待检测音频;然后,对待检测音频做分帧处理,得到多个音频帧;再获取每一音频帧的信号功率,得到时域维度上的信号功率序列;最后,根据该时域维度上的信号功率序列从多个音频帧中确定出发音音频帧。利用检测出的发音音频帧,即可对待检测音频做进一步处理,比如,当待检测音频为歌曲音频时,可以进行歌词识别和/或旋律检测等后续处理。本专利技术实施例提供一种音频检测方法,在本专利技术实施例中,将从音频检测装置的角度进行描述,如图1a所示,该音频检测方法的流程可以如下:101,当接收到音频检测请求时,获取待检测音频。其中,可以通过多种不同的方式接收音频检测请求,比如,音频检测装置可以通过其所在的检测设备向用户提供音频检测界面,该音频检测界面包括提示信息和请求输入接口,如图1b所示,提示信息为“请选择需要进行检测的音频”该请求输入接口可以为输入框的形式,用户可以在该输入框形式的请求输入接口中键入需要进行音频检测的音频的标识信息(比如储存路径、音频名称等),并输入确认信息(比如直接按下键盘的回车键)以输入音频检测请求,该音频检测请求携带有需要进行音频检测的音频的标识信息。相应的,音频检测装置在接收到输入的音频检测请求时,即可将音频检测请求中携带的标识信息所指示的音频作为待检测音频,并获取到该待检测音频,用于后续检测。又比如,在图1b所述的音频检测界面中,还包括“打开”控件,一方面,音频检测装置在侦测到该打开控件触发时,将在音频检测界面之上叠加显示选择子界面(如图1c所示),该选择子界面提供本地可进行音频检测的音频的文件图标,如音频A、音频B、音频C、音频D、音频E、音频F等音频的文件图标,供用户查找并选中需要进行音频检测的音频的图标;另一方面,用户可以在选中需要检测的音频的文件图标之后,触发选择子界面提供的确认控件,以向音频检测装置输入音频检测请求,该音频检测请求与用户选中的音频的音频图标相关联,指示音频检测装置将用户选中的音频作为待检测音频。此外,本领域普通技术人员还可以根据实际需要设置其它输入音频检测请求的具体实现方式,本专利技术对此不做具体限制。比如,音频检测装置还可以周期的自动产生音频检测请求,通过该音频检测请求指示对新增加的音频进行音频检测。102,对待检测音频做分帧处理,得到多个音频帧。应当说明的是,虽然音频信号在宏观上是不平稳的,但是其在微观上是平稳的,具有短时平稳性,通常认为音频信号在短时内是平稳的。因此,本专利技术实施例中,在获取到待检测音频之后,音频检测装置进一步对待检测音频进行分帧处理,得到多个音频帧,以用于后续处理。其中,对于如何对待检测音频进行分帧处理,本专利技术实施例不做具体限制,可由本领域普通技术人员根据实际需要配置,比如,本专利技术实施例中预先配置分帧处理的帧长为40毫秒,帧移为25%,由此,分帧得到n个音频帧,如图1d所示。在一实施例中,“对待检测音频做分帧处理,得到多个音频帧”之前,还包括:(1)按照预设采样频率对待检测音本文档来自技高网...

【技术保护点】
1.一种音频检测方法,其特征在于,所述音频检测方法包括:/n当接收到音频检测请求时,获取待检测音频;/n对所述待检测音频做分帧处理,得到多个音频帧;/n获取每一音频帧的信号功率,得到时域维度上的信号功率序列;/n根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧。/n

【技术特征摘要】
1.一种音频检测方法,其特征在于,所述音频检测方法包括:
当接收到音频检测请求时,获取待检测音频;
对所述待检测音频做分帧处理,得到多个音频帧;
获取每一音频帧的信号功率,得到时域维度上的信号功率序列;
根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧。


2.根据权利要求1所述的音频检测方法,其特征在于,所述根据所述时域维度上的信号功率序列从所述多个音频帧中确定出发音音频帧的步骤,包括:
对所述时域维度上的信号功率序列做平滑处理,得到平滑后的信号功率序列;
对所述平滑后的信号功率序列做差分处理,得到差分序列;
根据所述差分序列从所述多个音频帧中确定出所述发音音频帧。


3.根据权利要求2所述的音频检测方法,其特征在于,所述根据所述差分序列从所述多个音频帧中确定出所述发音音频帧的步骤,包括:
通过指数映射的方式对所述差分序列做归一化处理,得到归一化后的差分序列;
将所述归一化后的差分序列中,自身对应的值大于预设阈值以及前一音频帧对应的值小于所述预设阈值的音频帧,设为所述发音音频帧。


4.根据权利要求2所述的音频检测方法,其特征在于,所述对所述信号功率序列做平滑处理,得到平滑后的信号功率序列的步骤,包括:
获取预设的平滑函数;
根据所述平滑函数对所述信号功率序列做卷积运算,得到所述平滑后的信号功率序列。


5.根据权利要求1所述的音频检测方法,其特征在于,所述获取每一音频帧的信号功率的步骤,包括:
获取所述待检测音频的采样频率,根据所述采样频率确定所述音频帧中的采样点;
获取每一采样点的幅值,并确定出所有幅值的中值;
将所述中值的平方值设为所述音频...

【专利技术属性】
技术研发人员:张超鹏
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1