音频重音识别方法、装置、设备和介质制造方法及图纸

技术编号:27133512 阅读:27 留言:0更新日期:2021-01-25 20:25
本发明专利技术公开了一种音频重音识别方法,该方法包括:获取原始音频信号;获取目标高斯窗函数,根据目标高斯窗函数对原始音频信号进行处理,得到原始音频信号对应的能量变化曲线;获取目标滑动窗,根据目标滑动窗确定能量变化曲线中的重音时刻,将在重音时刻的原始音频信号标示为音频重音。本发明专利技术充分考虑音频信号在时间上的相关性,相较于传统算法,后续重音识别的结果更为准确。同时本发明专利技术排除了音频局部强度波动过大对整体音频识别造成的影响,因此也更具科学性及实用性。此外,还提出了音频重音识别装置、设备和存储介质。设备和存储介质。设备和存储介质。

【技术实现步骤摘要】
音频重音识别方法、装置、设备和介质


[0001]本专利技术涉及音频处理
,尤其是涉及音频重音识别方法、装置、设备和介质。

技术介绍

[0002]不管是日常的说话交流、音乐影音、还是语音通话,都可以通过录音将声音保存为一段或多段音频信号。音频信号作为可保存的数据,是信息传播的重要媒介。重音是音乐中强度较大的音,在声音的冲击上最为突出,是构成音乐节奏的主要因素,通过对音乐中的重音进行识别,可以判断出音乐节奏的快慢。此外重音常常会包含一定的主观情绪或者重点信息,通过对音频中的重音进行识别,可因分辨出音频中的主观情绪和重点信息。因此可以说,对于音频重音进行分析识别可以更加充分的了解该段音频信号所要表达的含义。

技术实现思路

[0003]基于此,有必要针对上述问题,提供可准确识别的音频重音识别方法、装置、设备和介质。
[0004]一种音频重音识别的方法,所述方法包括:
[0005]获取原始音频信号;
[0006]获取目标高斯窗函数,根据所述目标高斯窗函数对所述原始音频信号进行处理,得到所述原始音频信号对应的能量变化曲线;
[0007]获取目标滑动窗,根据所述目标滑动窗确定所述能量变化曲线中的重音时刻,将在所述重音时刻的所述原始音频信号标示为音频重音。
[0008]在其中一个实施例中,所述根据所述目标高斯窗函数对所述原始音频信号进行处理,得到所述原始音频信号对应的能量变化曲线,包括:
[0009]根据所述目标高斯函数对所述原始音频信号进行加权计算,得到所述原始音频信号对应的能量曲线;
[0010]对所述能量曲线进行数值转换处理,得到所述原始音频信号对应的能量变化曲线。
[0011]在其中一个实施例中,所述根据所述目标高斯函数对所述原始音频信号进行加权计算,得到所述原始音频信号对应的能量曲线,包括:
[0012]根据所述目标高斯窗函数确定所述原始音频信号在目标时刻的截断音频信号;其中,所述目标时刻为所述原始音频信号中的任意一个时刻;
[0013]将所述截断音频信号与所述目标高斯窗函数进行加权计算,获取所述原始音频信号在所述目标时刻的目标能量值,根据在每一目标时刻的所述目标能量值得到所述原始音频信号对应的能量曲线。
[0014]在其中一个实施例中,所述根据所述目标高斯窗函数确定所述原始音频信号在目标时刻的截断音频信号,包括:
[0015]以所述目标时刻为所述目标高斯窗函数对应的高斯窗口的中间时刻,在所述原始音频信号上添加高斯窗口;
[0016]将所述高斯窗口内的音频信号作为在所述目标时刻的截断音频信号。
[0017]在其中一个实施例中,所述对所述能量曲线进行数值转换处理,得到所述原始音频信号对应的能量变化曲线,包括:
[0018]对所述能量曲线进行取对数处理,获取所述原始音频信号对应的对数函数;
[0019]对所述对数函数进行二次求导处理,获取所述原始音频信号对应的能量变化曲线。
[0020]在其中一个实施例中,所述根据所述目标滑动窗确定所述能量变化曲线中的重音时刻,包括:
[0021]在所述能量变化曲线中添加所述目标滑动窗,获取所述目标滑动窗内所述能量变化曲线的能量变化峰值,将所述能量变化峰值对应的时刻作为重音时刻;其中,所述目标滑动窗在起始位置的起始点为所述能量变化曲线的起始点;
[0022]按照预设步长滑动所述目标滑动窗,返回执行所述获取所述目标滑动窗内所述能量变化曲线的能量变化峰值,将所述能量变化峰值对应的时刻作为重音时刻的步骤。
[0023]在其中一个实施例中,在所述将所有能量变化峰值对应的时刻作为重音时刻之前还包括:
[0024]判断所述能量变化峰值是否大于或等于能量变化阈值;
[0025]若所述能量变化峰值大于或等于能量变化阈值,则继续执行所述将所述能量变化峰值对应的时刻作为重音时刻的步骤;
[0026]若所述能量变化峰值小于能量变化阈值,则继续执行所述按照预设步长滑动所述目标滑动窗的步骤。
[0027]一种音频重音识别装置,所述装置包括:
[0028]能量变化曲线获取模块,用于获取原始音频信号;获取目标高斯窗函数,根据所述目标高斯窗函数对所述原始音频信号进行处理,得到所述原始音频信号对应的能量变化曲线;
[0029]重音识别模块,用于获取目标滑动窗,根据所述目标滑动窗确定所述能量变化曲线中的重音时刻,将在所述重音时刻的所述原始音频信号标示为音频重音。
[0030]一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
[0031]获取原始音频信号;
[0032]获取目标高斯窗函数,根据所述目标高斯窗函数对所述原始音频信号进行处理,得到所述原始音频信号对应的能量变化曲线;
[0033]获取目标滑动窗,根据所述目标滑动窗确定所述能量变化曲线中的重音时刻,将在所述重音时刻的所述原始音频信号标示为音频重音。
[0034]一种音频重音识别设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
[0035]获取原始音频信号;
[0036]获取目标高斯窗函数,根据所述目标高斯窗函数对所述原始音频信号进行处理,
得到所述原始音频信号对应的能量变化曲线;
[0037]获取目标滑动窗,根据所述目标滑动窗确定所述能量变化曲线中的重音时刻,将在所述重音时刻的所述原始音频信号标示为音频重音。
[0038]本专利技术提供了音频重音识别方法、装置、设备和介质,基于高斯窗函数对原始音频信号进行处理,充分考虑音频信号在时间上的相关性,相较于传统算法,后续重音识别的结果更为准确。进一步的,还基于滑动窗动态识别局部能量变化的最强烈点,并将其标记为重音时刻从而识别出音频重音,本专利技术排除了音频局部强度波动过大对整体音频识别造成的影响,因此也更具科学性及实用性。
附图说明
[0039]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0040]其中:
[0041]图1为第一实施例中音频重音识别方法的流程示意图;
[0042]图2为一个实施例中目标高斯窗函数的示意图;
[0043]图3为一个实施例中根据目标滑动窗确定重音时刻的示意图;
[0044]图4为一个实施例中确定的所有重音时刻的示意图;
[0045]图5为第二实施例中音频重音识别分法的流程示意图;
[0046]图6为一个实施例中能量曲线的示意图;
[0047]图7为一个实施例中对原始音频信号做加权处理的示意图;
[0048]图8为一个实施例中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频重音识别的方法,其特征在于,所述方法包括:获取原始音频信号;获取目标高斯窗函数,根据所述目标高斯窗函数对所述原始音频信号进行处理,得到所述原始音频信号对应的能量变化曲线;获取目标滑动窗,根据所述目标滑动窗确定所述能量变化曲线中的重音时刻,将在所述重音时刻的所述原始音频信号标示为音频重音。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标高斯窗函数对所述原始音频信号进行处理,得到所述原始音频信号对应的能量变化曲线,包括:根据所述目标高斯函数对所述原始音频信号进行加权计算,得到所述原始音频信号对应的能量曲线;对所述能量曲线进行数值转换处理,得到所述原始音频信号对应的能量变化曲线。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标高斯函数对所述原始音频信号进行加权计算,得到所述原始音频信号对应的能量曲线,包括:根据所述目标高斯窗函数确定所述原始音频信号在目标时刻的截断音频信号;其中,所述目标时刻为所述原始音频信号中的任意一个时刻;将所述截断音频信号与所述目标高斯窗函数进行加权计算,获取所述原始音频信号在所述目标时刻的目标能量值,根据在每一目标时刻的所述目标能量值得到所述原始音频信号对应的能量曲线。4.根据权利要求3所述的方法,其特征在于,所述根据所述目标高斯窗函数确定所述原始音频信号在目标时刻的截断音频信号,包括:以所述目标时刻为所述目标高斯窗函数对应的高斯窗口的中间时刻,在所述原始音频信号上添加高斯窗口;将所述高斯窗口内的音频信号作为在所述目标时刻的截断音频信号。5.根据权利要求2所述的方法,其特征在于,所述对所述能量曲线进行数值转换处理,得到所述原始音频信号对应的能量变化曲线,包括:对所述能量曲线进行取对数处理,获取所述原始音频信号对应的对数函数;对所述对数函数进...

【专利技术属性】
技术研发人员:郑亚军
申请(专利权)人:瑞声光电科技常州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利