一种实时音乐语音识别系统技术方案

技术编号：7845771 阅读：134 留言：0更新日期：2012-10-13 03:30

本发明专利技术提供了嵌入式实时音乐语音识别系统，设计并实现了一种嵌入式实时音乐语音识别系统。叙述了音乐语音识别系统硬件结构、软件流程，建立了一种基于多频段能量曲线分割结合过零率来检测端点的新方法，实验结果表明，该系统对特定人的平均识别率在97%以上。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音乐语音识别，更具体地讲，涉及嵌入式实时音乐语音识别系统。
技术介绍
语音识别的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域，是一个多学科综合性研究领域。随着电子音乐的快速发展，迫切需要一种更智能、更便捷的用户操作系统。自动音乐语音识别系统能够提供便利的人机交互，方便人们自己学习音乐知识，将成为一种主要方法，也是一个发展的方向。目前，实验室环境中自动语音识别系统已经取得了很好的效果，但是应用于电子音乐方面的自动音乐语音识别却很少。当自动语音识别应用于电子音乐时，必须对识别方法进行相应改进，才能满足其对运算速度、内存资源等方面的要求。为了解决这个问题，本文将结合音乐语音的特点，设计并实现嵌入式音乐语音识别系统。
技术实现思路
本专利技术的目的在于提供一种实时音乐语音识别系统，该采用了一种基于多频段能量曲线分割结合过零率来检测端点的新方法，简化了运算量，进一步提高了识别性能，把语音识别技术很好的用在电子音乐方面，实现了嵌入式实时音乐语音识别，实验结果表明，本系统精度高，基本能满足实用化需求。为了解决上述技术问题，本专利技术提供一种嵌入式实时音乐语音识别系统。一种实时音乐语音识别系统，其特征在于，包括硬件电路主要由音乐语音信息采集部分、音乐语音处理DSP部分、程序数据存储器FLASH部分、数据存储器SRAM部分、键盘管理部分、音源芯片语音输出部分、以及电源部分组成；音乐语音识别设计音乐语音识别软硬件系统，采用滤波、消除毛刺的预处理方法，提高语音识别精度；检测端点建立一种基于多频段能量曲线分割结...

【技术保护点】

【技术特征摘要】
1.一种实时音乐语音识别系统，其特征在于，包括硬件电路主要由音乐语音信息采集部分、音乐语音处理DSP部分、程序数据存储器FLASH部分、数据存储器SRAM部分、键盘管理部分、音源芯片语音输出部分、以及电源部分组成；音乐语音识别设计音乐语音识别软硬件系统，采用滤波、消除毛刺的预处理方法，提高语音识别精度；检测端点建立一种基于多频段能量曲线分割结合过零率来检测端点的方法，在保证不错分的情况下，提高语音分割的正确率，同时结合过零率的门限，提高端点检测的精度。2.根据权利要求I所述的实时音乐语音识别系统，其特征在于所述的音乐语音识别包括语音信号预处理，端点检测，特征参数求取和语音识别的步骤，具体内容如下语音信号预处理对语音信号进行前期的优化处理，方便后面的端点检测和语音识别；语音信号预处理主要包括分帧处理、预加重处理、加窗处理、滤波和消除毛刺处理；检测端点使用语音信号的能量曲线结合过零率来进行端点检测，从带有噪声的语音中检测出说话人的语音命令，找出语音段开始和结束的时点；语音特征参数提取采用美尔频标倒谱参数MFCC ；语音信号的训练与识别采用DTW算法来进行语音识别；基于动态规划的思想，将语音信号的每一帧信号的特征参数提取出来，转化成一组特征向量；将特征向量同模板库中已存的语音特征向量进行模板匹配，寻找距离最短的模板。3.根据权利要求2所述的实时音乐语音识别系统，其特征在于所述的检测端点，具体内容如下 ...

【专利技术属性】
技术研发人员：苏淳，
申请(专利权)人：太仓博天网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人