音频重音识别方法、装置、设备和介质制造方法及图纸

技术编号：27133512 阅读：27 留言：0更新日期：2021-01-25 20:25

本发明专利技术公开了一种音频重音识别方法，该方法包括：获取原始音频信号；获取目标高斯窗函数，根据目标高斯窗函数对原始音频信号进行处理，得到原始音频信号对应的能量变化曲线；获取目标滑动窗，根据目标滑动窗确定能量变化曲线中的重音时刻，将在重音时刻的原始音频信号标示为音频重音。本发明专利技术充分考虑音频信号在时间上的相关性，相较于传统算法，后续重音识别的结果更为准确。同时本发明专利技术排除了音频局部强度波动过大对整体音频识别造成的影响，因此也更具科学性及实用性。此外，还提出了音频重音识别装置、设备和存储介质。设备和存储介质。设备和存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
音频重音识别方法、装置、设备和介质

[0001]本专利技术涉及音频处理
，尤其是涉及音频重音识别方法、装置、设备和介质。

技术介绍

[0002]不管是日常的说话交流、音乐影音、还是语音通话，都可以通过录音将声音保存为一段或多段音频信号。音频信号作为可保存的数据，是信息传播的重要媒介。重音是音乐中强度较大的音，在声音的冲击上最为突出，是构成音乐节奏的主要因素，通过对音乐中的重音进行识别，可以判断出音乐节奏的快慢。此外重音常常会包含一定的主观情绪或者重点信息，通过对音频中的重音进行识别，可因分辨出音频中的主观情绪和重点信息。因此可以说，对于音频重音进行分析识别可以更加充分的了解该段音频信号所要表达的含义。

技术实现思路

[0003]基于此，有必要针对上述问题，提供可准确识别的音频重音识别方法、装置、设备和介质。
[0004]一种音频重音识别的方法，所述方法包括：
[0005]获取原始音频信号；
[0006]获取目标高斯窗函数，根据所述目标高斯窗函数对所述原始音频信号进行处理，得到所述原始音频信号对应的能量变化曲线；
[0007]获取目标滑动窗，根据所述目标滑动窗确定所述能量变化曲线中的重音时刻，将在所述重音时刻的所述原始音频信号标示为音频重音。
[0008]在其中一个实施例中，所述根据所述目标高斯窗函数对所述原始音频信号进行处理，得到所述原始音频信号对应的能量变化曲线，包括：
[0009]根据所述目标高斯函数对所述原始音频信号进行加权计算，得到所述原始...

【技术保护点】

【技术特征摘要】
1.一种音频重音识别的方法，其特征在于，所述方法包括：获取原始音频信号；获取目标高斯窗函数，根据所述目标高斯窗函数对所述原始音频信号进行处理，得到所述原始音频信号对应的能量变化曲线；获取目标滑动窗，根据所述目标滑动窗确定所述能量变化曲线中的重音时刻，将在所述重音时刻的所述原始音频信号标示为音频重音。2.根据权利要求1所述的方法，其特征在于，所述根据所述目标高斯窗函数对所述原始音频信号进行处理，得到所述原始音频信号对应的能量变化曲线，包括：根据所述目标高斯函数对所述原始音频信号进行加权计算，得到所述原始音频信号对应的能量曲线；对所述能量曲线进行数值转换处理，得到所述原始音频信号对应的能量变化曲线。3.根据权利要求2所述的方法，其特征在于，所述根据所述目标高斯函数对所述原始音频信号进行加权计算，得到所述原始音频信号对应的能量曲线，包括：根据所述目标高斯窗函数确定所述原始音频信号在目标时刻的截断音频信号；其中，所述目标时刻为所述原始音频信号中的任意一个时刻；将所述截断音频信号与所述目标高斯窗函数进行加权计算，获取所述原始音频信号在所述目标时刻的目标能量值，根据在每一目标时刻的所述目标能量值得到所述原始音频信号对应的能量曲线。4.根据权利要求3所述的方法，其特征在于，所述根据所述目标高斯窗函数确定所述原始音频信号在目标时刻的截断音频信号，包括：以所述目标时刻为所述目标高斯窗函数对应的高斯窗口的中间时刻，在所述原始音频信号上添加高斯窗口；将所述高斯窗口内的音频信号作为在所述目标时刻的截断音频信号。5.根据权利要求2所述的方法，其特征在于，所述对所述能量曲线进行数值转换处理，得到所述原始音频信号对应的能量变化曲线，包括：对所述能量曲线进行取对数处理，获取所述原始音频信号对应的对数函数；对所述对数函数进...

【专利技术属性】
技术研发人员：郑亚军，
申请(专利权)人：瑞声光电科技常州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人