嵌入式语音识别系统技术方案

技术编号:3048016 阅读:175 留言:0更新日期:2012-04-11 18:40
本实用新型专利技术公开了一种嵌入式语音识别系统,包括语音拾取装置,与语音拾取装置相连的模数转换器,与模数转换器相连的识别算法部分,主程序部分与识别算法部分、增益控制部分及驱动控制等执行部分相连接,以及用于存储识别器算法固定参数的内存器,所述的语音识别算法部分包括与模数转换器相接的端点检测部分、前置降噪、特征提取和隐式马尔科夫模型识别器部分,马尔科夫模型识别器还与语言模型参数模块和参数适配模块相适配,端点检测部分与特征提取部分均与增益控制部分连接,其优点是:算法模型科学合理,通过嵌入式语音识别技术的优化设计,实现了系统的最佳使用效果。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本技术涉及一种语音的自动识别技术,尤其涉及一种用于小规模语音 识别产品的嵌入式语音识别系统
技术介绍
自动语音识别技术属于IT行业比较边缘的技术,经20多年的发展已逐步 走向成熟。它是采用电脑或独立电子装置来自动识别人类自然语音的技术,因 而,可以应用于任何需要使用语音向电子装置输入信息的情景。特别是最近五 年来,由于微电子产业的快速发展以及相关
的成熟,使得语音识别这 一长期以来的愿望逐步成为可能。嵌入式语音识别技术,特指在电脑以外的独立装置上运行的技术。业界逐 渐认为,它有着比非嵌入式语音识别技术更广泛的应用范围和前景。由于语音 识别技术本身的诸多复杂性,以及一般嵌入式——如手机等装置,需要额外解 决如环境噪音等诸多问题,因此,使得这一领域不论在国内还是在国外,至今 均没有出现令人满意的实用产品。进而,由于小型嵌入式——如智能玩具等单 一芯片系统,需要面对低成本限制所带来的系统资源有限,并且需要达到一定 的识别准确率,因此,就更加具有挑战性。目前,大多数嵌入式语音识别系统中的关键内核技术,都是采用现成芯片或 模块集成到系统中去的,由于存在抗噪音和有限系统资源等方面存在的问题, 因此,这些芯片或模块都不能做到相对完善的程度,市场上也不存在标准的产 品供开发者选用并集成。另外,由于系统控制方式与算法的缺陷,也使得该系 统使用时要占用大量系统资源,在识别过程中有可能会耗费大量电能,从而影 响嵌入式语音识别系统的正常使用。
技术实现思路
本技术的目的在于提供一种嵌入式语音识别系统,它针对于中小型嵌 入式语音识别技术的特点,通过科学合理的算法模型,并通过芯片或模块的设 计优化与集成,使系统达到较佳的使用性能。为实现本技术的目的, 一种嵌入式语音识别系统,包括语音拾取装置,与语音拾取装置相连的模数转换器,与模数转换器相连的识别算法部分,主程 序部分与识别算法部分、增益控制部分及驱动控制等执行部分相连接,以及用 于存储识别器算法固定参数的内存器,所述的语音识别算法部分包括与模数转换器相接的端点检测部分、前置降噪、特征提取和隐式马尔科夫模型(H丽)识 别器部分,马尔科夫模型识别器还与语言模型参数模块和参数适配模块相适配, 端点检测部分与特征提取部分均与增益控制部分连接。本技术的优点是该系统通过科学的算法模型,结合嵌入式语音识别 技术的优化设计,解决了语音识别技术在现实使用过程中的瓶颈,从而实现了 以最经济有效的形式达到中小型语音识别系统所要达到的使用要求。以下结合附图对本技术嵌入式语音识别系统作进一步的详细说明-附图说明图1为本技术嵌入式语音识别系统的工作原理框图; 图2为本技术嵌入式语音识别系统中识别器的工作原理框图。具体实施方式如图l、 2所示, 一种嵌入式语音识别系统,主要包括语音拾取装置,与语 音拾取装置相连的模数转换器,与模数转换器相连的识别算法部分,主程序部 分与识别算法部分、增益控制部分及驱动控制等执行部分相连接,以及用于存 储识别器算法固定参数的内存器;上述的语音拾取装置主要是指有线或无线的 话筒;上述的主程序控制部分通过声频输出与扬声器相连,对话过程中识别器 发出的语音、音乐由该扬声器发出;上述的语音识别算法部分包括与模数转换 器相接的端点检测部分、前置降噪、特征提取和隐式马尔科夫模型(HMM)识别 器部分,马尔科夫模型识别器还与语言模型参数模块和参数适配模块相适配, 端点检测部分与特征提取部分均与增益控制部分连接;由所述模数转换器、识 别算法部分、主程序部分、增益控制部分及驱动控制执行部分等组成的专用集 成电路(ASIC),其结构基础采用数字信号处理器(DSP)类芯片作为基本硬件结 构,且内部包含有高效运算单元和外围接口电路,所述的数字信号处理器(DSP) 类芯片采用16位定点数字信号处理器(DSP),系统电路中还设置有电平唤醒电路,该电路设置在语音拾取装置之后并与主程序部分连接。 具体结构及工作过程描述如下如图1所示,为嵌入式语音识别系统的总体结构。其中黑线框内为专用集成电路(ASIC)部分,虚线所示模块表示在某些类型系统中的可选部分。当语 音拾取装置采用单一的话筒时,该主话筒收取语音输入信号,经模数转换为数 码信号,送至识别器算法部分。在多话筒产品中,另有一个或多个辅话筒收取 其它信号经有线或无线连接传送到另外路径的模数转换,同样送到识别器算法。 这些辅话筒的信号作用是,在某些声场环境下,更佳地去除背景噪音影响的算 法所用。所有模数转换器的增益可以经算法和主程序进行动态控制。识别的输 出结果经必要的控制驱动,对外部动作进行控制,例如电动机、灯、显示等, 具体控制的类型和数量根据需要而设定。语音识别和对话过程中识别器发出的 语音或音乐等输出,经声频输出推动扬声器发声。内存器用来存储识别器算法 所用的固定参数部分,以及识别过程需要的变化部分。另外,整个系统还设置 有电池供电。在有些类型的系统中,还需要有外存来存储部分的模型和系统参 数,以灵活地满足中小批量客户的多样需求。如图2所示,为所述语音识别器及其相关的主要算法部分。经模数转换的 连续数码输入信号,由端点探测模块确定输入信号中语音部分的起始和结束点; 这样可以使语音识别算法部分仅仅集中计算属于语音的信号。同时,结合外部 简单的电平唤醒电路,系统诸多运算模块在多数没有声音的时间段,都处于低 耗电的待机状态。在探测到语音输入时,由一有限状态机协助确定,并在这段 时间内进行语音识别的运算。而后,根据单话筒或多话筒系统,基于当时环境 噪音的强弱,动态地压缩噪音部分,尽量保持干净的语音信号进入后继模块。 降噪模块部分地利用了端点探测的结果,来区分含语音及纯噪音的信号。特征 提取模块将输入语音信号分成等时间间隔的祯,对每一祯的数码语音信号进行数字信号处理操作,而获取简捷描述最有用的语音信息部分,称为特 征向量。输入部分的增益控制量的计算采用一部分特征;同时利用了端点探测 模块所获取的对于噪音的跟踪区别信息,从而对于纯噪音输入信号提供小增益。 全部的语音特征送至隐式马尔科夫模型(HMM)识别器进行识别。识别的过程 同时需要模型参数,包括训练好的语音模型参数,以及关于语法的语 言模型参数,参数适配模块动态地对语音特征向量的多种变化进行适配,包括 音量变化、说话者语音变化、以及声音传输通道特性如空间回音带来的变化等, 适配的效果是尽量忽略这些变化,使得这些变化对于语音识别效果的影响达到 最小。语音识别的结果,包括识别到的词汇序列、关键词、以及理解到的概念单元,输出到系统其它部分。本技术中,这种嵌入式语音识别技术所涉及的内核技术是-在语言参数的模块中,为在小型数字信号处理器(DSP)硬件平台上实现连 续语音识别、语音理解和关键词检出功能所采取的一种子词单元,作为隐 式马尔科夫模型(HMM)模型参数的结构单元,所选子词为包含临域影响的通 用无调双音(context dependent generalized toneless biphone)。这禾中具体子i司适应 于中文语音识别,而对于其它语种的识别有类似技术手段来定义最合适的子词 单元;在上述的嵌入式语音识别系统的内核技术中,所述的包含临域影响的通 用本文档来自技高网...

【技术保护点】
一种嵌入式语音识别系统,包括语音拾取装置,与语音拾取装置相连的模数转换器,与模数转换器相连的识别算法部分,主程序部分与识别算法部分、增益控制部分及驱动控制等执行部分相连接,以及用于存储识别器算法固定参数的内存器,其特征在于:所述的语音识别算法部分包括与模数转换器相接的端点检测部分、前置降噪、特征提取和隐式马尔科夫模型(HMM)识别器部分,马尔科夫模型识别器还与语言模型参数模块和参数适配模块相适配,端点检测部分与特征提取部分均与增益控制部分连接。

【技术特征摘要】
1、一种嵌入式语音识别系统,包括语音拾取装置,与语音拾取装置相连的模数转换器,与模数转换器相连的识别算法部分,主程序部分与识别算法部分、增益控制部分及驱动控制等执行部分相连接,以及用于存储识别器算法固定参数的内存器,其特征在于所述的语音识别算法部分包括与模数转换器相接的端点检测部分、前置降噪、特征提取和隐式马尔科夫模型(HMM)识别器部分,马尔科夫模型识别器还与语言模型参数模块和参数适配模块相适配,端点检测部分与特征提取部分均与增益控制部分连接。2、 根据权利要求1所述的一种嵌入式语音识别系统,其特征在于由所述 模数转换器、识别算法部分、主程序部分、增益控制部分及驱动控制执行部分等组...

【专利技术属性】
技术研发人员:王雪
申请(专利权)人:张家港市思韵语音科技有限公司
类型:实用新型
国别省市:32[中国|江苏]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1