一种基于节拍谱特征的语音音乐分类模型制造技术

技术编号:27605562 阅读:14 留言:0更新日期:2021-03-10 10:29
本使用新型公开了一种基于节拍谱特征的语音音乐分类模型,属于语音信号处理技术领域。本发明专利技术摒弃单纯利用信号的短时时域特征或者短时频域特征,而是创新性地将音乐的节拍谱作为特征区分语音音乐信号。此方法在针对语音及音乐两类信号中,首先对训练数集进行预处理,计算训练数集的节拍谱,得到语音音乐分类的阈值,接着对测试数据计算节拍谱,最后通过阈值对节拍谱进行判断类别。阈值对节拍谱进行判断类别。阈值对节拍谱进行判断类别。

【技术实现步骤摘要】
一种基于节拍谱特征的语音音乐分类模型


[0001]本专利技术涉及信息处理
,尤其涉及一种基于节拍谱的话音分类模型。

技术介绍

[0002]目前,对语音音乐有多种方法:如回声器时频分析计算平均能量谱及定长片段的优化短时低能量比,接着分类器判定类型,并根据内容连续性对分段结果修改。又如基于感知机的区分,主要提取信号的短时幅度、音调等通过阈值判定信号类别。使用过零率等特征来区分广播中的音乐与语音信号。又有基于各态历经混合高斯密度隐马尔可夫模型的分类器,提取了信号的子带能量比、带宽均值等8个特征值应用于语音、音乐的分类。这些分类方法需要提取较多特征参数或者各种分类器来实现分类如文献,忽视了音乐具有节拍这一特性,而本专利技术着重于音乐的节拍这一特征去对音频进行区分。

技术实现思路

[0003]本专利技术要解决的技术问题是:本专利技术针对现有技术的局限和不足,提供一种基于节拍谱特征的话音分类方法,摒弃单纯利用传统的短时时域特征和短时频域特征等,利用音乐具有节拍性来区分话音型号。
[0004]为实现上述目的,本专利技术提供了如下方案:具体步骤:
[0005]1.将待识别的音频信号提取得带节拍谱数据;
[0006]2.对节拍谱数据使用模型进行阈值判定,当超出阈值即判定音频信号为音乐信号,反之则为语音信号;
[0007]本专利技术的有益效果是:本专利技术摒弃单纯利用传统的语音信号的短时时域特征和短时频域特征,对音乐具有节拍这一特性去区分话音类别。本专利技术与现有技术相比,主要解决了现有技术使用传统的特征而忽略了音乐具有节拍这一特性。比起传统特征,本专利技术使用音乐具有节拍谱这一特性去区分语音音乐信号。
附图说明
[0008]为使本专利技术的目的、技术方案和优点更加清楚,下面通过附图和具体实施例,对本专利技术作进一步详细说明。
[0009]图1、本专利技术流程示意图;
[0010]图2、本专利技术的节拍谱提取示意图;
[0011]图3、本专利技术的音乐节拍谱图;
[0012]图4、本专利技术的说话声节拍谱图;图5、本专利技术的阈值确定步骤图;
具体实施方式
[0013]下面图1所示:本专利技术提供一种基于节拍谱的语音音乐分类方法方法,该方法具体
包括以下步骤:
[0014]1:将待识别的音频信号提取得到节拍谱;
[0015]2:通过训练集确定模型阈值,阈值主要由训练集的准确率来确定的;
[0016]3:使用模型对测试集进行区分得到此模型的准确率。
[0017]如图2所示:本专利技术提供一种基于节拍谱的话音分类图像识别方法方法,该方法中语音信号的节拍谱提取步骤如下:
[0018]Step1:待计算的语音信号。
[0019]Step2:计算语音信号的美尔频率倒谱系数Mel{x}。
[0020][0021]Step3:计算测试数据集的相似矩阵。其中,x(i)、x(j)为求出的美尔频率倒谱系数的第i帧,第j帧,R(i,j)为相似矩阵。
[0022][0023]Step4:节拍谱通过计算相似矩阵的自相关得到自相关矩阵。
[0024][0025]Step5:自相关矩阵对角线相加得到语音信号的节拍谱图。根据图2步骤计算,得到了音频信号的节拍谱。
[0026]本实施例的具体结果为对话音音频区分的准确率达到98%,证明了本专利技术对话音分类是有效的。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于节拍谱的话音分类模型,其特征在于:将待识别的音频信号使用阈值判断音频的节拍谱得到音频类别,该方法具体包括以下步骤:Step1:搜集话音音频的训练数据集;Step2:对训练数据集中每个话音音频计算得到节拍谱;Step3:通过节拍谱确定阈值。统计音频节拍谱数据大于阈值的个数,当节拍谱中大于阈值个数比小于阈值个数多,即判定为音乐信号,反之则为语音信号;Step4:得到基于节拍谱的语音音乐分类模型。Step5:搜集语音音乐音频的测试数据集;Step6:计算测试数据集每个话音的节拍谱;Step7:使用模型区分测试数据集每个音频。。tep8:测试集验证此模型准确率为98%,能对待测音频信号准确区分为语音信号还是音乐信号。2.根据权利要求1所述基于节拍谱的话音分类模型,该分类方法的音频节拍谱提取具体包括以下步骤:1:待计算的语音信号。2:计算语音信号的美尔频率倒谱系数Mel{x}。式中Mel{x}...

【专利技术属性】
技术研发人员:龙华郑清杰邵玉斌杜庆治
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1