一种基于多特征的语音识别方法技术

技术编号:28678429 阅读:34 留言:0更新日期:2021-06-02 02:55
本发明专利技术公开了一种基于多特征的语音识别方法,包括以下步骤:S10、接收一未知语音信号;S20、进行FFT变换;S30、提取39维MFCC特征参数以及过零率特征向量,共40维MFCC特征参数,记为集合T

【技术实现步骤摘要】
一种基于多特征的语音识别方法
本专利技术涉及语音识别
,尤其涉及一种基于多特征的语音识别方法。
技术介绍
语音识别包含说话人识别和说话人语义识别两种,前者利用的是语音信号中说话人的个性特征,不考虑包含在语音中的字词的含义,强调的是说话人的个性;而后者的目的是识别出语音信号中的语义内容,并不考虑说话人的个性,强调的是语音的共性。现有的说话人识别技术如图1所示,主要基于39维MFCC(Mel频率倒谱系数)特征参数进行匹配,一方面,匹配特征单一,噪声嘈杂环境下,MFCC谱分辨率较低,降低声音匹配鲁棒性,同时,语音特征信息中MFCC参数高频部分能量易丢失,降低声音匹配率;另一方面,MFCC特征参数音色匹配正确率不高。因此,针对上述问题,有必要提出进一步地解决方案以至少解决一问题。
技术实现思路
本专利技术旨在提供一种基于多特征的语音识别方法,以克服现有技术中存在的不足。为解决上述技术问题,本专利技术的技术方案是:一种基于多特征的语音识别方法,包括以下步骤:S10、接收一未知语音信号,进行预处理;本文档来自技高网...

【技术保护点】
1.一种基于多特征的语音识别方法,其特征在于,包括以下步骤:/nS10、接收一未知语音信号,进行预处理;/nS20、对经预处理后的所述未知语音信号进行FFT变换;/nS30、对经FFT变换后的所述未知语音信号提取39维MFCC特征参数以及过零率特征向量,共40维MFCC特征参数,记为集合T

【技术特征摘要】
1.一种基于多特征的语音识别方法,其特征在于,包括以下步骤:
S10、接收一未知语音信号,进行预处理;
S20、对经预处理后的所述未知语音信号进行FFT变换;
S30、对经FFT变换后的所述未知语音信号提取39维MFCC特征参数以及过零率特征向量,共40维MFCC特征参数,记为集合T1;
S40、对经FFT变换后的所述未知语音信号提取1/3倍频程特征向量,记为集合T2;
S50、将集合T1和集合T2分别与预设模型库中各个样本的对应特征集合进行欧式距离最近邻匹配,计算对应两者的差值,得到MFCC特征差值集合E1,1/3倍频特征差值集合E2;
S60、将集合E1中的各个差值分别与设定的距离阈值R1比较,得到匹配相似度S1%,将E2中的各个差值分别与设定的距离阈值R2比较,得到匹配相似度S2%;
S70、根据S1%和S2%均符合匹配度阈值所对应的样本,输出所述未知语音信号所属的用户。


2.根据权利要求1所述的基于多特征的语音识别方法,其特征在于,构建残差平方和函数,对所述40维MFCC特征参数进行最小二乘处理。


3.根据权利要求1所述的基于多特征的语音识别方法,其特征在于,构建残差平方和函数,对所述1/3倍频程特征向量进行最小二乘处理。


4.根据权利要求1-3任一所述的基于多特征的语音识别方法,其特征在于,其中,步骤S5中所述预设模型库的建立,包括以下步骤:
S01、指定人在时间t内读取一段中文文本,以该段语音作为样本语音信号,对所述样本语音信号进行预处理;
S02、对经预处理后的所述样本语音信号进行FFT变换;
S03、对经FFT变换后的所述样本语音信号提取39维MFCC特征...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:上海头趣科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1