基于支持向量机的语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：23346375 阅读：34 留言：0更新日期：2020-02-15 04:54

本发明专利技术实施例公开了一种基于支持向量机的语音识别方法、装置、设备及存储介质，其中，所述方法包括：从语音数据中提取梅尔频率倒谱系数的特征量；对所述语音数据进行去噪处理；对所述特征量根据贡献量进行加权处理；获取所述语音数据中的语音时序特征，并与经过加权处理后的特征量进行组合；将组合后的特征量输入训练完成后的语音识别支持向量机，得到语音识别结果。不仅可以对干扰信息实现过滤，增强真实语音信号，同时考虑到发声的特征，能够在复杂的外界环境下增强对语音的识别。

Speech recognition method, device, equipment and storage medium based on support vector machine

全部详细技术资料下载

【技术实现步骤摘要】
基于支持向量机的语音识别方法、装置、设备及存储介质
本专利技术涉及语音识别
，尤其涉及一种基于支持向量机的语音识别方法、装置、设备及存储介质。
技术介绍
语音识别技术是人机接口应用的前沿技术之一，作为语音信号处理的一个研究方向，近年来语音识别得到了迅速发展，在国际化浪潮以及多民族和多文化的相互交织的大背景下，语音识别越来越受到人们的关注。语音识别在军事情报侦察领域具有十分重要的意义，可以侦察敌情，预警国家安全，预防突发事件的效用。在实现本专利技术的过程中，专利技术人发现如下技术问题：由于在军事领域，其较容易受到外界环境噪声的干扰，而噪声的干扰会严重影响语音识别的效果，导致识别准确率低，无法有效识别语音类别。
技术实现思路
本专利技术实施例提供了一种基于支持向量机的语音识别方法、装置、设备及存储介质，以解决上述提及的至少一个技术问题。第一方面，本专利技术实施例提供了一种基于支持向量机的语音识别方法，包括：从语音数据中提取梅尔频率倒谱系数的特征量；对所述语音数据进...

【技术保护点】
1.一种基于支持向量机的语音识别方法，其特征在于，包括：/n从语音数据中提取梅尔频率倒谱系数的特征量；/n对所述语音数据进行去噪处理；/n对所述特征量根据贡献量进行加权处理；/n获取所述语音数据中的语音时序特征，并与经过加权处理后的特征量进行组合；/n将组合后的特征量输入训练完成后的语音识别支持向量机，得到语音识别结果。/n

【技术特征摘要】
1.一种基于支持向量机的语音识别方法，其特征在于，包括：
从语音数据中提取梅尔频率倒谱系数的特征量；
对所述语音数据进行去噪处理；
对所述特征量根据贡献量进行加权处理；
获取所述语音数据中的语音时序特征，并与经过加权处理后的特征量进行组合；
将组合后的特征量输入训练完成后的语音识别支持向量机，得到语音识别结果。

2.根据权利要求1所述的方法，其特征在于，所述从语音数据中提取梅尔频率倒谱系数的特征量，包括：
对语音数据进行预加重处理；
对预加重处理后的语音数据进行加窗分帧；
对各帧数据进行快速傅里叶变换；
对变换后的数据进行三角波滤波，并计算对数能量谱；
对对数能量谱进行余弦变换，输出梅尔频率倒谱系数的特征量。

3.根据权利要求2所述的方法，其特征在于，所述对所述语音数据进行去噪处理包括：
利用训练完成后的去噪支持向量机对语音数据进行去噪。

4.根据权利要求3所述的方法，其特征在于，所述语音时序特征包括：
幅值和过零率。

5.根据权利要求4所述的方法，其特征在于，所述对所述特征量根据贡献量进行加权处理包括：
对所述特征参数求取类间方差或类内方差，根据类间方差或类内方差确定加权值；
根据所述加权值对特征参数进行加权处理。

【专利技术属性】
技术研发人员：褚孝鹏，李萌，赵辰，龚政，邱惠昌，
申请(专利权)人：天津光电通信技术有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人