【技术实现步骤摘要】
一种语音识别方法及语音识别系统
本专利技术涉及语音识别
,特别涉及一种语音识别方法及语音识别系统。
技术介绍
随着计算机技术和信息技术的发展,语音交互已经成为人机互动的必要手段,在这种形势下,如何让计算机智能化地与人通信,使人机交流更加自然方便成为现代计算机科学的一个重要研究课题。完整的语音识别系统包括了预处理、特征参数提取、相似比较以及识别成功的后续步骤。在预处理中,分帧、端点检测等都是重要的处理手段,对语音信号进行预处理能够加大系统的识别成功率;端点检测技术能够提取信号中的语音部分,在减少系统计算量的同时,提高了整体的识别精度。同时,语音识别系统采用特征值对比来识别命令,将频域内的语音信号进行处理后取其系数表示该段信号的特征值。然而现有技术中,对端点检测提取语音数据部分,效果较差,难以提取有效的语音数据,造成语音识别出现错误。动态时间规整是特征匹配算法里的一种重要的方法,现有技术中,语音识别的过程中,每段语音信号的时间长度不会保持相同,而且每个词内部各个部分的相对时长也是随机变化的,因此现有技术中采用的特征矢量来进行相似性的比较,其效果往往较差。因此,为 ...
【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:获取语音信号,转换为语音数据,对语音数据进行预处理剔除无关噪声;从剔除无关噪声后的语音数据中提取线性预测倒谱系数,得到语音数据的特征部分;将提取的语音数据特征与模板库中的语音数据进行相似度匹配,其中,对提取的语音数据特征进行动态时间规整,包括:定义代价函数Φ[(ni,mi)]=(ni‑1,mi‑1),表示动态时间规整路径当前点(ni,mi)的前一网格点(ni‑1,mi‑1),动态时间规整路径上的点满足如下约束:a、动态时间规整路径上的起始点(1,1),终止点(N,M);b、以所述起始点和终止点作为某一平行四边形相对的顶点,动态 ...
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取语音信号,转换为语音数据,对语音数据进行预处理剔除无关噪声;从剔除无关噪声后的语音数据中提取线性预测倒谱系数,得到语音数据的特征部分;将提取的语音数据特征与模板库中的语音数据进行相似度匹配,其中,对提取的语音数据特征进行动态时间规整,包括:定义代价函数Φ[(ni,mi)]=(ni-1,mi-1),表示动态时间规整路径当前点(ni,mi)的前一网格点(ni-1,mi-1),动态时间规整路径上的点满足如下约束:a、动态时间规整路径上的起始点(1,1),终止点(N,M);b、以所述起始点和终止点作为某一平行四边形相对的顶点,动态时间规整路径上的点全部落入所述平行四边形内;不断迭代所述代价函数,使提取的语音数据特征与模板库中的语音数据匹配。2.根据权利要求1所述的方法,其特征在于,所述预处理包括,语音数据进行采样和量化,语音数据预加重处理,语音数据加窗、分帧处理,以及通过语音数据端点检测剔除无关噪声。3.根据权利要求2所述的方法,其特征在于,所述语音数据端点检测通过短时能量判断语音数据端点,短时能量通过如下方法表述:其中,o(j)为第帧语音数据,j为帧数,g(t)为对数化的一维短时能量,I窗长,n为当前窗内第一帧语音数据。4.根据权利要求3所述的方法,其特征在于,所述语音数据端点检测通过短时能量判断语音数据端点,将短时能量与端点检测滤波器卷积:其中,H(i)为端点检测滤波器,g(t)为对数化的一维短时能量,F(t)为短时能量与端点检测滤波器卷积后得到的语音数据,当F(t)小于某一阈值,则将该语音数据作为无关噪声剔除。5.根据权利要求1所述的方法,其特征在于,所述模板库的语音数据通过如下方法训练得到:获取训练语音,转换为训练语音数据,对训练语音数据进行预处理剔除无关噪声;从剔除无关噪声后的训练语音数据中提取线性预测倒谱系数,得到训练语音数据的特征部分;将得到的训练语音的特征部分送入模板库。6.一种语音识别系统,其特征在于,所述系统包...
【专利技术属性】
技术研发人员:林孝康,傅嵩,葛宛营,
申请(专利权)人:重庆高开清芯科技产业发展有限公司,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。