一种基于节拍谱特征的语音音乐分类模型制造技术

技术编号：27605562 阅读：14 留言：0更新日期：2021-03-10 10:29

本使用新型公开了一种基于节拍谱特征的语音音乐分类模型，属于语音信号处理技术领域。本发明专利技术摒弃单纯利用信号的短时时域特征或者短时频域特征，而是创新性地将音乐的节拍谱作为特征区分语音音乐信号。此方法在针对语音及音乐两类信号中，首先对训练数集进行预处理，计算训练数集的节拍谱，得到语音音乐分类的阈值，接着对测试数据计算节拍谱，最后通过阈值对节拍谱进行判断类别。阈值对节拍谱进行判断类别。阈值对节拍谱进行判断类别。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于节拍谱特征的语音音乐分类模型

[0001]本专利技术涉及信息处理
，尤其涉及一种基于节拍谱的话音分类模型。

技术介绍

[0002]目前，对语音音乐有多种方法：如回声器时频分析计算平均能量谱及定长片段的优化短时低能量比，接着分类器判定类型，并根据内容连续性对分段结果修改。又如基于感知机的区分，主要提取信号的短时幅度、音调等通过阈值判定信号类别。使用过零率等特征来区分广播中的音乐与语音信号。又有基于各态历经混合高斯密度隐马尔可夫模型的分类器，提取了信号的子带能量比、带宽均值等8个特征值应用于语音、音乐的分类。这些分类方法需要提取较多特征参数或者各种分类器来实现分类如文献，忽视了音乐具有节拍这一特性，而本专利技术着重于音乐的节拍这一特征去对音频进行区分。

技术实现思路

[0003]本专利技术要解决的技术问题是：本专利技术针对现有技术的局限和不足，提供一种基于节拍谱特征的话音分类方法，摒弃单纯利用传统的短时时域特征和短时频域特征等，利用音乐具有节拍性来区分话音型号。
[0004]为实现上述目的，本专利技术提供了如下方案：具体步骤：
[0005]1.将待识别的音频信号提取得带节拍谱数据；
[0006]2.对节拍谱数据使用模型进行阈值判定，当超出阈值即判定音频信号为音乐信号，反之则为语音信号；
[0007]本专利技术的有益效果是：本专利技术摒弃单纯利用传统的语音信号的短时时域特征和短时频域特征，对音乐具有节拍这一特性去区分话音类别。本专利技术与现有技术相比，主要解决了...

【技术保护点】

【技术特征摘要】
1.一种基于节拍谱的话音分类模型，其特征在于：将待识别的音频信号使用阈值判断音频的节拍谱得到音频类别，该方法具体包括以下步骤：Step1：搜集话音音频的训练数据集；Step2：对训练数据集中每个话音音频计算得到节拍谱；Step3：通过节拍谱确定阈值。统计音频节拍谱数据大于阈值的个数，当节拍谱中大于阈值个数比小于阈值个数多，即判定为音乐信号，反之则为语音信号；Step4:得到基于节拍谱的语音音乐分类模型。Step5：搜集语音音乐音频的测试数据集；Step6：计算测试数据集每个话音的节拍谱；Step7：使用模型区分测试数据集每个音频。。tep8:测试集验证此模型准确率为98％，能对待测音频信号准确区分为语音信号还是音乐信号。2.根据权利要求1所述基于节拍谱的话音分类模型，该分类方法的音频节拍谱提取具体包括以下步骤：1：待计算的语音信号。2：计算语音信号的美尔频率倒谱系数Mel{x}。式中Mel{x}...

【专利技术属性】
技术研发人员：龙华，郑清杰，邵玉斌，杜庆治，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人