当前位置: 首页 > 专利查询>山东大学专利>正文

基于随机森林的语音声调识别方法及系统技术方案

技术编号:26306108 阅读:25 留言:0更新日期:2020-11-10 20:04
本发明专利技术公开了基于随机森林的语音声调识别方法及系统,包括:获取待识别的语音信号,对待识别的语音信号进行预处理;对预处理后的待识别的语音信号进行特征参数的提取与选择;将提取的特征参数,输入到预先训练好的随机森林模型中,输出待识别的语音信号的声调识别结果。随机森林的实现简单、运算速度快、抗噪声能力强等优点,在声调识别中可以得到很好的应用,能够在确保识别准确率的同时,使声调分类器的运算复杂度降到最低。

【技术实现步骤摘要】
基于随机森林的语音声调识别方法及系统
本申请涉及语音声调识别
,特别是涉及基于随机森林的语音声调识别方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本申请相关的
技术介绍
,并不必然构成现有技术。汉语是一种具有声调的语言,除轻声外,汉语共有四种声调。声调体现为声音的高低升降,在汉语中具有重要的辨意作用,不同的声调代表着不同的含义,例如拼音“ma”,用四种声调发声时分别可由汉字“妈”、“麻”、“马”和“骂”表示。因此,声调作为汉语的重要组成部分在人们的日常交流中起到了不可或缺的作用。同时,在人机交互中经常会用到语音作为通信方式,语音识别是通过计算机将语音信号转变为相应的文本或命令的技术,其中声调识别是语音识别的重要组成部分。现阶段在声调识别的研究中采用的特征参数主要可分为两类:仅使用基频作为特征参数和使用基频及其他特征作为特征参数,其他特征主要包括时长、能量、MFCC(梅尔频率倒谱系数)等。对于基频有许多种不同的处理方式,比如求出关于基频的基本统计量、对基频轨迹进行规范化处理和对基频轨迹进行曲线拟合等等。但是关于哪些特征参数在声调识别中表现最好、对于基频应该进行怎样的处理等问题,一直没有一个统一的定论。同时,在声调分类器部分,目前应用较多的是神经网络模型、SVM(支持向量机)模型和HMM(隐马尔可夫模型),但是这些模型在建模当中同样存在一些问题。对于神经网络模型,现阶段应用最多的是使用基频、声谱图或MFCC作为特征参数在卷积神经网络或深度神经网络中进行声调识别。但是这些方法在计算声谱图和MFCC时计算量大,卷积神经网络和深度神经网络的构建也十分复杂,同时识别准确率不高,且神经网络中隐藏层的层数和节点数等参数的选择和其他参数的优化一般根据经验,没有一个统一的标准。同样的,在使用SVM模型时,核函数的选取是一个很重要的问题,但目前比较成熟的核函数及其参数的选择都是人为的,且经典的SVM算法只能进行二分类,若要应用到声调识别等多分类的问题中需要使用多个二分类的SVM,这无疑增加了计算复杂度。而且当待识别数据存在含有噪声、不平衡、具有缺失等问题时,这些模型的识别准确率均会受到较大影响,鲁棒性较差。
技术实现思路
为了解决现有技术的不足,本申请提供了基于随机森林的语音声调识别方法及系统;第一方面,本申请提供了基于随机森林的语音声调识别方法;基于随机森林的语音声调识别方法,包括:获取待识别的语音信号,对待识别的语音信号进行预处理;对预处理后的待识别的语音信号进行特征参数的提取与选择;将提取的特征参数,输入到预先训练好的随机森林模型中,输出待识别的语音信号的声调识别结果。第二方面,本申请提供了基于随机森林的语音声调识别系统;基于随机森林的语音声调识别系统,包括:预处理模块,其被配置为:获取待识别的语音信号,对待识别的语音信号进行预处理;特征提取模块,其被配置为:对预处理后的待识别的语音信号进行特征参数的提取与选择;声调识别模块,其被配置为:将提取的特征参数,输入到预先训练好的随机森林模型中,输出待识别的语音信号的声调识别结果。第三方面,本申请还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。第四方面,本申请还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。第五方面,本申请还提供了一种计算机程序(产品),包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现前述第一方面任意一项的方法。与现有技术相比,本申请的有益效果是:本专利技术提出了一种基于随机森林的语音声调识别。随机森林的实现简单、运算速度快、抗噪声能力强等优点,在声调识别中可以得到很好的应用,能够在确保识别准确率的同时,使声调分类器的运算复杂度降到最低。与其他声调分类器相比,随机森林识别准确率高,实现比较简单,可以通过修改决策树的数量来进行优化,且决策树的数量可以控制在一定范围内,不像BPNN(BP神经网络)和SVM的优化只能根据经验。随机森林运行速度快,而且非常稳定,抗过拟合能力比较强,一般不会出现较大偏差。当数据中出现NaN(非数)较多时,朴素贝叶斯、BPNN和SVM的分类准确率均受到了较大影响,但是随机森林的准确率并未出现较大波动,这说明随机森林对于噪声数据、存在缺失的数据和非平衡数据具有很好的鲁棒性。本专利技术中进行了特征参数的优化和使用了随机森林作为声调识别分类器,在特征优化部分,只保留了权重排名靠前且能提升识别准确率的特征参数,这就减少了不必要的参数计算,在保证识别准确率的同时降低了计算复杂度。随机森林是应用在分类和回归问题上的优秀的机器学习方法,具有实现简单、运算速度快、抗噪声能力强等优点,将随机森林应用到声调识别中可以带来整体声调识别系统性能的提升。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为第一个实施例的声调识别系统整体流程框图;图2为第一个实施例的随机森林在声调识别中的训练过程和待识别语音信号在随机森林中的识别过程;图3为第一个实施例的随机森林中的一棵决策树。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。随机森林(randomforest)是一种基于分类树的集成学习方法,由Breiman和Cutler在2001年提出,它将大量决策树整合起来形成森林,在运算量没有显著增加的前提下提高了模型的预测精度,是足以取代神经网络等传统方法的高效机器学习方法。随机森林的运算速度很快,在处理大数据时表现优异,对于噪声数据、存在缺失的数据和非平衡数据具有很好的鲁棒性。随机森林主要应用在分类和回归问题上,汉语普通话声调识别就是一种典型的四分类问题。本专利技术是将随机森林这一高效的机器学习方法应用到语音声调识别任务中去,利用随机森林实现简单、本文档来自技高网
...

【技术保护点】
1.基于随机森林的语音声调识别方法,其特征是,包括:/n获取待识别的语音信号,对待识别的语音信号进行预处理;/n对预处理后的待识别的语音信号进行特征参数的提取与选择;/n将提取的特征参数,输入到预先训练好的随机森林模型中,输出待识别的语音信号的声调识别结果。/n

【技术特征摘要】
1.基于随机森林的语音声调识别方法,其特征是,包括:
获取待识别的语音信号,对待识别的语音信号进行预处理;
对预处理后的待识别的语音信号进行特征参数的提取与选择;
将提取的特征参数,输入到预先训练好的随机森林模型中,输出待识别的语音信号的声调识别结果。


2.如权利要求1所述的方法,其特征是,所述对待识别的语音信号进行预处理,包括:对待识别的语音信号依次进行采样、低通滤波、分帧和清浊判定。


3.如权利要求1所述的方法,其特征是,所述对预处理后的待识别的语音信号进行特征参数的提取与选择;具体步骤包括:
对待识别的语音信号进行特征参数的综合选定,得到一个含有N0个特征参数的参数集;
使用特征权重算法根据各个参数对声调分类的贡献度求出其所占权重;
按照权重由大到小的顺序,挑选出前N个构成优选的声调特征矢量。


4.如权利要求1所述的方法,其特征是,所述使用特征权重算法求出参数集中各个参数在识别过程中所占的权重,是采用ReliefF算法来实现的。


5.如权利要求1所述的方法,其特征是,预先训练好的随机森林模型的训练步骤包括:
在训练过程中,输入训练集数据量为M*N,M表示训练样本的数量,其中包含L类声调,N表示构成每个样本声调特征的参数数量,决策树数量取值为T;
(1):首先,在每棵树的训练过程中,对训练集进行M次有放回的随机抽取,得到样本量为M的采样集,其中训练集中的数据有的被抽取多次,有的没有被抽取;
(2):其次,在每棵树的每个节点处,从N个特征中随机选择n个特征,其中n<N,在这n个特征中选择最佳分割特征作为节点构建决策树,在每个节点进行一次决策,经过多次决策得到L类声调中的某类声调;
(3):重复(1)和(2)设定次数,所述设定...

【专利技术属性】
技术研发人员:田岚李濛刘国洋范辉
申请(专利权)人:山东大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1