小词汇量语音识别方法及其模块技术

技术编号：3047517 阅读：222 留言：0更新日期：2012-04-11 18:40

本发明专利技术属于语音识别技术领域，其方法包括采样、编码，频谱整形及分帧加窗，语音特征提取，端点检测，模式识别等步骤。其模块由码本存储器、采样编码器、信号处理器、微控制器组成。本发明专利技术提出的方法，特别解决了非特定人汉语数码语音识别中几个易混淆对的语音区分问题，以提高汉语数码“０”～“９”的语音识别性能。且采用该方法实现的语音识别模块具有体积小、重量轻、耗电省、成本低等突出特点。（*该技术在2018年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音识别
，尤其涉及采用单片信号处理器实现小词汇量的语音识别(包括汉语数码“0”～“9”的语音识别)方法及其模块的设计。在90年代初，国外已有采用单片信号处理器(Digit Signal Processor简写为DSP)实现的语音识别器，虽然这些识别器是非特定人的语音识别器，但限于英语或日语的数码“0”～“9”语音及词组语音，而汉语非特定人的数码语音识别至今尚未实用化，尤其是将非特定人的汉语数码、词组以及特定人词组的语音识别功能在一片DSP上实现并付诸实用化尚未有先例。观以语音数码拨号电话机为例说明目前这一技术的现状。在90年代初期，国外已有语音拨号电话的产品出现，语音拨号电话产品采用了语音识别专用集成电路，如东芝的TC8860F等。其主要技术特点是只能对特定人语音识别，最多可识别十个词且每个词允许的持续时间为0.96秒，因此这些电路的识别性能并不理想。Philips公司于1996年推出的数字移动通信手机产品上实现了声控电话功能，其效果较好，但是限定识别十个人名的特定人声控手机。一般语音识别方法的基本流程如下图1所示语音进入系统的识别过程分以下几步(1)语音进入后，进行采样及编码成为原始的数字语音信号。系统要保存全部原始的数字语音信号成为语音记录。(2)对保存的语音记录进行语音起始和终了的端点检测，进行端点定位。(3)对经过端点定位后的语音信号进行频谱整形及分帧加窗处理。(4)对已分帧加窗信号进行特征提取。(5)提取出的语音信号特征后，根据已存的码本进行模识识别。(6)把语音识别的结果输出。这一方法中语音端点检测精确到采样点的量级...

【技术保护点】
一种小词汇量语音识别方法，包括以下步骤：（１）语音进入系统后进行采样及编码，成为原始的数字语音信；（２）对原始的数字语音信号进行频谱整形及分帧加窗；（３）对己分帧的信号立即进行语音特征提取，当一帧信号的特征提取结束后，就不再保存该帧原始的数字语音信号，只保存该帧的特征；（４）对保存的各帧语音的特征进行确定起始终了端点的语音端点检测；（５）语音端点定位后，根据已存的码本进行模式识别；（６）把语音识别的结果输出。

【技术特征摘要】
1.一种小词汇量语音识别方法，包括以下步骤(1)语音进入系统后进行采样及编码，成为原始的数字语音信；(2)对原始的数字语音信号进行频谱整形及分帧加窗；(3)对已分帧的信号立即进行语音特征提取，当一帧信号的特征提取结束后，就不再保存该帧原始的数字语音信号，只保存该帧的特征；(4)对保存的各帧语音的特征进行确定起始终了端点的语音端点检测；(5)语音端点定位后，根据已存的码本进行模式识别；(6)把语音识别的结果输出。2.如权利要求1所述的语音识别方法，其特征在于，所说的语音端点检测包括以下步骤(1)语音经过采样、编码、分帧、加窗以及特征提取后，进行参数阀值的设定；(2)确定参数阀值后，进行浊音段定位；(3)然后搜索静音段，从而确定语音端点。3.如权利要求1所述的语音识别方法，其特征在于，所说的模式识别采用二级汉语数码语音识别方法，具体包括以下步骤首先采用典型HMM识别方法进行第一级识别；然...

【专利技术属性】
技术研发人员：刘润生，杨明杰，李虎生，
申请(专利权)人：清华大学，
类型：发明
国别省市：41[中国|河南]

全部详细技术资料下载我是这个专利的主人