用于语音识别的方法、装置和设备制造方法及图纸

技术编号:15050409 阅读:115 留言:0更新日期:2017-04-05 21:57
一种用于语音识别的方法,包括:接收语音信息;提取所述语音信息中的语音特征信息;将所述语音特征信息和语音库中的语音模板进行匹配;匹配成功后利用所述语音特征信息重新训练所述语音库中的语音模板。由于每次语音识别后,都会重新训练语音库中的语音模板,这样使得语音模板越来越丰富,从而大大提高语音识别的成功率。在一些实施例中还公开一种用于语音识别的装置和一种具有语音识别功能的设备。

【技术实现步骤摘要】

本专利技术属于模式识别
,尤其涉及一种用于语音识别的方法、装置,和具有语音识别功能的设备。
技术介绍
当前,平板电脑、智能手机、智能家居产品等智能设备日益普及,逐步成为家庭和个人的标准配置。基于语音交互的智能设备已经实用化,在诸如家电、车机、手机等设备上已经有广泛应用,其中,很多设备都具有语音唤醒功能,用于屏幕解锁或者作为启动应用的辅助手段。语音唤醒是这样一项技术,当设备处于待机状态时,在非常低的功耗条件下,在后台不间断运行一个装置,对某个预先定义的唤醒词进行检测,当检测到用户说出这个词时,将设备唤醒,使该设备进入正常工作状态。但是目前语音识别技术的成功率还不是很理想,需要进一步提高。
技术实现思路
有鉴于此,本专利技术的一个目的是提出一种用于语音识别的方法,以提高语音识别的成功率。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。在一些可选的实施例中,所述用于语音识别的方法包括:接收语音信息;提取所述语音信息中的语音特征信息;将所述语音特征信息和语音库中的语音模板进行匹配;匹配成功后利用所述语音特征信息重新训练所述语音库中的语音模板。由于每次语音识别成功后,都会重新训练语音库中的语音模板,这样使得语音模板越来越丰富,从而大大提高语音识别的成功率。本专利技术的另一个目的是提出一种用于语音识别的装置。在一些可选的实施例中,所述用于语音识别的装置包括:接收语音信息的语音采集单元;提取所述语音信息中的语音特征信息的特征提取单元;将所述语音特征信息和语音库中的语音模板进行匹配的语音识别单元;和,重训练单元,用于在所述语音识别单元匹配成功后利用所述语音特征信息重新训练所述语音库中的语音模板。本专利技术的另一个目的是提出一种具有语音识别功能的设备。在一些可选的实施例中,所述具有语音识别功能的设备包括语音输入装置,还包括所述用于语音识别的装置。为了上述以及相关的目的,一个或多个实施例包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明某些示例性方面,并且其指示的仅仅是各个实施例的原则可以利用的各种方式中的一些方式。其它的益处和新颖性特征将随着下面的详细说明结合附图考虑而变得明显,所公开的实施例是要包括所有这些方面以及它们的等同。附图说明图1是一个用于语音识别的方法实施例;图2是一个用于语音识别的装置实施例;图3是另一个用于语音识别的装置实施例。具体实施方式以下描述和附图充分地示出本专利技术的具体实施方案,以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本专利技术的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。在本文中,本专利技术的这些实施方案可以被单独地或总地用术语“专利技术”来表示,这仅仅是为了方便,并且如果事实上公开了超过一个的专利技术,不是要自动地限制该应用的范围为任何单个专利技术或专利技术构思。图1示出了用于语音识别的方法的一个实施例。步骤11:接收语音信息;步骤12:提取语音信息中的语音特征信息;步骤13:将语音特征信息和语音库中的声学模型进行匹配;步骤14:匹配成功后利用语音特征信息重新训练语音库中的语音模型。对于语音识别技术,目前实现识别有意义、有内容的语音信息的基本方法是:预先分析出语音特征信息,按照要求送给机器储存起来,这个语音参数库中的语音特征信息称为“模板(Template-basedApproach)”,而这一过程称为“训练(Training)”。送来识别的未知语音(又称待识语音)变换成电信号后经过预处理、语音建模和特征提取,得到语音特征信息,将它与语音库中的语音模板一一比较,并采用匹配的方法找出最接近语音特征的模板,得出识别结果,这一过程就称为“识别(Recognition)”。当然,在进行比较时要有个标准,这就是计量语音参数矢量之间的“失真测度(DistortionMeasures)”,失真最小的那个模板所代表的内容就是识别的结果。语音识别过程一般分为两个阶段:训练阶段和识别阶段。前者的任务是建立识别基本单元的语音模型以及语言模型,后者则是将目标语音的语音特征参数和语音模板进行比较,得到识别结果。声学模型声学模型是识别系统的底层模型,是语音识别系统中最为关键的一部分。声学模型的目标是提供一种有效的方法,计算语音的特征矢量序列和每个语音模板之间的距离。声学模型的设计和语言发音特点密切相关。模型识别单元大小(词发音模型、字发音模型、半音节模型或音素模型)对语音训练数据量大小、语音识别率以及灵活性有较大的影响。对中等词汇量以上的语音识别系统来说,识别单元小,则计算量也小,所需的模型存储量和训练数据量也小,但带来的问题是对应语音段的定位和分割困难,以及更复杂的识别模型规则。通常大的识别单元容易包含协同发音在模型中,这有利于提高系统的识别率,但要求的训练数据相对增加。语言模型语言模型(LanguageModel,LM)一般指在匹配搜索时用于字词和路径约束的语言规则,是为了在语音识别的过程中有效地结合语法和语义的知识,提高识别率,减少搜索的范围。由于很难准确地确定词的边界,以及声学模型描述语音变异性的能力有限,识别时将产生很多概率得分相似的词的序列。因此,在实用的语音识别系统中通常使用语言模型从诸多候选结果中选择最有可能的词序列来弥补声学模型的不足。语言模型可以分为基于规则的语言模型和基于统计的语言模型。基于规则的语言模型是总结出语法规则乃至语义规则,然后用这些规则排除声学识别中不合语法规则或语义规则的结果。统计语言模型通过统计概率描述词与词之间的依赖关系,间接地对语法或语义规则进行编码。基于规则的语言模型在特定任务系统中获得很好的应用,可较大幅度提高系统的识别率。由于日常口语对话无法用严格的规则描述,在大词汇量语音识别系统中主要采用基于统计的语言模型。特征提取特征提取就是要从语音波形中提取出重要的反映语音特征的相关信息,去掉那些相对无关的信息。它既是一个信息大幅度压缩的过程,也是一个信号解卷过程。由于语音信号的时变特性,语音特征提取必须在一小段语音信号上进行,即进行短时分析。目前比较常用的语音特征提取方法是基于声道模型的线性预测倒谱技术(LPCC)和基于听觉机理的Mel频率倒谱技术(MFCC)。前者的基本思想在于:语音信号相邻的采样点之间有很强的相关性。因此每个语音信号的采样值,可以用它前面的若干个采样值的加权和线性组合来近似表示。后者则充分考虑了人耳的听觉特性,并用客观度量来表征人对声音高低的主观感受。相比之下,MFCC有一定的优势:1.语音的信息大多集中在低频部分,而高频部分易受环境噪声干扰,MFCC强调语音的低频信息,从而突出了有利于识别的信息,屏蔽了噪声干扰;2.MFCC没有任何前提假设,在各种情况下都可以使用,识别性能和噪声鲁棒性(即对噪声特性或者参数的不敏感性)优于LP本文档来自技高网...

【技术保护点】
一种用于语音识别的方法,其特征在于,包括:接收语音信息;提取所述语音信息中的语音特征信息;将所述语音特征信息和语音库中的语音模板进行匹配;匹配成功后利用所述语音特征信息重新训练所述语音库中的语音模板。

【技术特征摘要】
2015.09.28 CN 20151063177531.一种用于语音识别的方法,其特征在于,包括:接收语音信息;提取所述语音信息中的语音特征信息;将所述语音特征信息和语音库中的语音模板进行匹配;匹配成功后利用所述语音特征信息重新训练所述语音库中的语音模板。2.如权利要求1所述的方法,其特征在于,所述方法用于移动终端,还包括:匹配成功后,将所述移动终端从第一模式切换到第二模式。3.如权利要求1或2所述的方法,其特征在于,利用动态时间规整法、对数似然比法或对数似然值法将所述语音特征信息和语音库中的声学模型进行匹配。4.如权利要求1或2所述的方法,其特征在于,提取语音特征信息前,还包括对所述语音信息进行预处理。5.一种用于语音识别的装置,其特征在于,包括:接收语音信息的语音采集单元;提取所...

【专利技术属性】
技术研发人员:王斌杨帅曾明
申请(专利权)人:广东新信通信息系统服务有限公司
类型:发明
国别省市:广东;44

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1