语音识别方法、装置和蓝牙耳机制造方法及图纸

技术编号:10541592 阅读:145 留言:0更新日期:2014-10-15 17:08
本发明专利技术涉及一种语音识别方法。包括:训练命令集中的命令词,获取每个命令词的参考特征矢量序列以为该命令词构建参考模板,各个命令词的参考模板构成参考模板集;从待测语音信号中提取特征参数,生成待测特征矢量序列,待测特征矢量序列构成测试模板;将测试模板和参考模板集进行匹配以生成测试模板与每个参考模板的匹配分数;将各个参考模板的匹配分数和预设的第一门限值以及预设的第二门限值进行比对,如果各个参考模板的匹配分数中的次小得分和最小得分的差值大于第二门限值,且最小得分小于第一门限值,则最小得分的参考模板所对应的命令词被识别为待测语音信号中的命令词。实现了较低的误识别率和误拒绝率,且用户体验性较好。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种语音识别方法。包括:训练命令集中的命令词,获取每个命令词的参考特征矢量序列以为该命令词构建参考模板,各个命令词的参考模板构成参考模板集;从待测语音信号中提取特征参数,生成待测特征矢量序列,待测特征矢量序列构成测试模板;将测试模板和参考模板集进行匹配以生成测试模板与每个参考模板的匹配分数;将各个参考模板的匹配分数和预设的第一门限值以及预设的第二门限值进行比对,如果各个参考模板的匹配分数中的次小得分和最小得分的差值大于第二门限值,且最小得分小于第一门限值,则最小得分的参考模板所对应的命令词被识别为待测语音信号中的命令词。实现了较低的误识别率和误拒绝率,且用户体验性较好。【专利说明】
本专利技术语音识别领域,尤其涉及一种语音识别方法、装置和蓝牙耳机。 语音识别方法、装置和蓝牙耳机
技术介绍
随着智能手机的普及,使用蓝牙耳机的用户越来越多,尤其是开车用户。由于蓝 牙耳机体型较小,按键很少,一些蓝牙耳机需要按组合键来完成相应操作,因此造成蓝牙耳 机操作比较复杂,用户体验较差,尤其是在车载环境下,还涉及安全因素。现在市场上一些 高端蓝牙耳机已经支持通过语音命令来代替手工操作,但这些高端蓝牙耳机基本都支持 非特定人语音,在使用过程中,存在以下缺陷:1)语音命令事先已固定好,用户无法定制和 修改,无法满足用户个性化需求;2)非特定人语音识别算法对计算和存储资源要求较高, 导致目前支持非特定人语音识别的高端蓝牙耳机成本较高,功耗较大;3)只能支持一种语 音,例如英语或者中文普通话,缺少对地方方言支持。现有基于孤立词的特定人语音识别算 法能解决上述问题,孤立词,指的是用户发音方式,需要为识别命令集中每个命令词建立一 个模板;特定人,指的是识别和训发音人为同一个人,很容易支持多种语音和地方方言的支 持。 但是现有特定人语音识别算法虽然集内命令(已训练命令词)识别率较高,但集 外命令(没有训练命令词)误识别率也较高,即虚假接受类错误较高,这样会出现较多的误 识别,导致用户体验很差。 特定人语音识别算法为了解决集外命令的误识别,增加了一个门限值参数,如果 最小的DTW匹配分数小于该门限值,则接受这个识别结果,如果最小的DTW匹配分数大于该 门限值,则拒绝这个识别结果。但在实际应用中,由于外界环境噪声干扰,这个门限值很难 选择,选择过高,会导致误识别率较高,选择过低,会导致误拒绝率较高。
技术实现思路
本专利技术的目的是解决特定人语音识别时的误识别率和误拒绝率较高的问题,通过 双门限的识别分数后处理机制,保证特定人孤立词语音识别的误识别率和误拒绝率都维持 在很低的水平。 第一方面,本专利技术实施例提供了一种特定人孤立词的语音识别方法,所述方法包 括: 训练命令集中的命令词,获取每个命令词的参考特征矢量序列以为该命令词构建 参考模板,各个命令词的参考模板构成参考模板集; 从待测语音信号中提取特征参数,生成待测特征矢量序列,其中所述待测特征矢 量序列构成测试模板; 将所述测试模板和所述参考模板集进行匹配以生成所述测试模板与每个参考模 板的匹配分数; 将各个参考模板的匹配分数和预设的第一门限值以及预设的第二门限值进行比 对,如果各个参考模板的匹配分数中的次小得分和最小得分的差值大于第二门限值,且所 述最小得分小于第一门限值,则最小得分的参考模板所对应的命令词被识别为待测语音信 号中的命令词。 结合第一方面,在第一方面的第一种可能的实现方式中,所述训练命令集中的命 令词,获取每个命令词的参考特征矢量序列以为该命令词构建参考模板具体包括: 训练命令集中的命令词,每一个所述命令词至少训练两遍以获取至少两组特征矢 量序列,如果所述两组特征矢量序列中的第一组特征矢量序列和第二组特征矢量序列的失 真得分小于预设门限,根据所述第一组特征矢量序列和所述第二组特征矢量序列确定该命 令词的参考特征矢量序列以为该命令词构建参考模板,其中所述训练命令集包括集内命令 。 结合第一方面,在第一方面的第二种可能的实现方式中,所述参考特征矢量序列 包括参考MFCC的C1-C12倒谱分量和1阶差分系数构成的24维特征参数,所述待测特征矢 量序列包括待测MFCC的C1-C12倒谱分量和1阶差分系数构成的24维特征参数; 所述将所述测试模板和所述参考模板集进行匹配以生成所述测试模板与每个参 考模板的匹配分数,具体包括: 利用DTW算法,将所述测试模板的待测特征矢量序列中由MFCC的C1-C12倒谱分 量和1阶差分系数构成的24维特征参数和所述参考模板集中的每个参考模板的参考特征 矢量序列中由MFCC的CI-C12倒谱分量和1阶差分系数构成的24维特征参数分别进行运 算,获取所述测试模板相对于每个参考模板的匹配分数。 结合第一方面,在第一方面的第三种可能的实现方式中,所述训练命令集包括集 内命令词和集外命令词,在预设环境下,对集外命令词和集内命令词分别进行录音和特征 提取,将获取到的特征矢量序列与所述参考模板集进行匹配,生成所述特征矢量序列的得 分,利用直方图统计方法,确定第一门限值和第二门限值。 第二方面,本专利技术实施例提供了一种语音识别装置,所述装置包括:第一获取单 元,第二获取单元,匹配单元,比对单元; 所述第一获取单元,用于训练命令集中的命令词,获取每个命令词的参考特征矢 量序列以为该命令词构建参考模板,各个命令词的参考模板构成参考模板集; 所述第二获取单元,从待测语音信号中提取特征参数,生成待测特征矢量序列,其 中所述待测特征矢量序列构成测试模板; 所述匹配单元,用于将所述测试模板和所述参考模板集进行匹配以生成所述测试 模板与每个参考模板的匹配分数; 所述比对单元,用于将各个参考模板的匹配分数和预设的第一门限值以及预设的 第二门限值进行比对,如果各个参考模板的匹配分数中的次小得分和最小得分的差值大于 第二门限值,且所述最小得分小于第一门限值,则最小得分的参考模板所对应的命令词被 识别为待测语音信号中的命令词。 结合第二方面,在第二方面的第一种可能的实现方式中,所述第一获取单元具体 用于: 训练命令集中的命令词,每一个所述命令词至少训练两遍以获取至少两组特征矢 量序列,如果所述两组特征矢量序列中的第一组特征矢量序列和第二组特征矢量序列的失 真得分小于预设门限,根据所述第一组特征矢量序列和所述第二组特征矢量序列确定该命 令词的参考特征矢量序列以为该命令词构建参考模板,其中所述训练命令集包括集内命令 。 结合第二方面,在第二方面的第二种可能的实现方式中,所述参考特征矢量序列 包括参考MFCC的C1-C12倒谱分量和1阶差分系数构成的24维特征参数,所述待测特征矢 量序列包括待测MFCC的C1-C12倒谱分量和1阶差分系数构成的24维特征参数; 所述匹配单元具体用于,利用DTW算法,将所述测试模板的待测特征矢量序列中 由MFCC的C1-C12倒谱分量和1阶差分系数构成的24维特征参数和所述参考模板集中的 每个参考模板的参考特征矢量序列中由MFCC的CI-C12倒谱分量和1阶差分系数构成的24 维特征参数分别进行运算,获取所本文档来自技高网
...
语音识别方法、装置和蓝牙耳机

【技术保护点】
一种语音识别方法,其特征在于,所述方法包括:训练命令集中的命令词,获取每个命令词的参考特征矢量序列以为该命令词构建参考模板,各个命令词的参考模板构成参考模板集;从待测语音信号中提取特征参数,生成待测特征矢量序列,其中所述待测特征矢量序列构成测试模板;将所述测试模板和所述参考模板集进行匹配以生成所述测试模板与每个参考模板的匹配分数;将各个参考模板的匹配分数和预设的第一门限值以及预设的第二门限值进行比对,如果各个参考模板的匹配分数中的次小得分和最小得分的差值大于第二门限值,且所述最小得分小于第一门限值,则最小得分的参考模板所对应的命令词被认为待测语音信号中的命令词。

【技术特征摘要】

【专利技术属性】
技术研发人员:冯宇红
申请(专利权)人:无锡中星微电子有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1