一种仿人机器人的语音识别系统技术方案

技术编号:8626847 阅读:182 留言:0更新日期:2013-04-26 00:14
本发明专利技术公开一种语音识别系统,包括语音输入模块、预处理模块、特征提取模块、训练模块、识别模块、识别决策模块、阈值比较模块,语音输入模块的输出端与预处理模块的输入端连接,预处理模块的输出端与特征提取模块的输入端连接,特征提取模块的输出端分别与训练模块、识别模块的输入端连接,训练模块与识别模块连接;识别模块的输出端与识别决策模块的输入端连接,识别决策模块的输出端与阈值比较模块的输入端连接。本发明专利技术采用隐马尔科夫(HMM)模型及小波变换和神经网络技术,采用阈值比较来进一步决策,提高识别率。

【技术实现步骤摘要】
一种仿人机器人的语音识别系统
本专利技术是一种基于仿人机器人的语音识别系统,用于智能机器人,也可用于智能系统或智能装备,人机交互装置等等。
技术介绍
能够用语音与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情,也是人类一直以来的一个理想,就是让各种机器能听懂人类的语言并能按人的口头命令来行动,从而实现人机的语言交流。随着科学技术的不断发展,出现了语音识别技术,使人类的这个理想逐渐得以实现。但是要完全实现这个理想还需人类的不懈努力。语音识别技术就是让机器通过识别和理解语音信号,并将其转换成为相应的文本或命令的技术。语音识别是近年来十分活跃的一个研究领域。其应用领域非常广泛,常见的有语音输入系统、语音控制系统、语音拨号系统、智能家电等等。在不远的将来语音识别技术有可能作为一种重要的人机交互手段,辅助甚至取代传统的键盘、鼠标等输入设备,在个人计算机上进行文字录入和操作控制。而在手持式PDA、智能家电、工业现场控制等应用场合,语音识别技术则有更为广阔的发展前景。尤其是在包括PDA、手机等的掌上型嵌入式系统中, 键盘的存在已经大大妨碍了系统的小型化,然而这些系统越来越趋向于智能化、信息化,不仅可以显示大量的文字和图形,还需要提供方便的文字输入能力,传统的键盘输入方式已经不能胜任,而语音识别技术就是一种极富潜力的替代手段。并且,语音技术的应用已经成为一个具有竞争性的新兴技术产业。因此研究语音识别技术有着广泛的应用价值和发展前旦-5^ O语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。 语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。但语音识别主要还面临着有以下五个问题(I)、对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则;(2)、语音信息量大。语音模式不仅对不同的说话人不同,对同一说话人也是不同的,例如,一个说话人在随意说话和认真说话时的语音信息时不同的。一个人的说话方式随着时间变化;(3)、语音的模糊性。说话者在讲话时,不同的词可能听起来是相似的。这在英语和汉语中常见;(4)、单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等;(5)、环境噪声和干扰对语音识别有严重影响,致使识别率低。近几十年来,很多专家、学者带着这些问题,不断地研究与探索,使得语音识别技术得到发展。并基于语音识别技术构造了各种各样地语音识别系统。目 前语音识别系统的应用领域有电话通信的语音拨号、汽车的语音控制、工业控制及医疗领域、个人数字助理 (Personal Digital Assistant,PDA)、智能玩具、家电遥控等等。人们不断的研究语音识别 技术,是希望有一天能够达到像人和人之间交流一样,人和机器也能实现自由的对话,从而 实现工业生产的自动化、智能化。随着科技的发展和人们对语音识别理论的逐渐深入化的 研究,理论体系的日趋成熟,随着数字信号处理技术的发展,在未来20年,语音识别技术将 逐渐的进入工业、家电、通信、汽车电子、医疗以及各种电子设备中。可以肯定地说,语音识 别技术必将成为未来信息产业中的一项关键的技术。但是也不可否认,它还有很长的一段 路需要走,要真正的商业化,还需要在多方面取得突破性的进展,还需要借助于其它相关学 科的发展。
技术实现思路
本专利技术是一种语音识别系统,主要目的是提供一种高效的、稳定的、实用性强的、 高识别率的语音识别系统。为实现上述目的,本专利技术以MATLAB为实现工具,结合迎宾仿人机器人平台。搭建 好完整的语音识别系统,用户利用平台通过麦克风语音命令,输入语音信号经处理、识别, 得出结果作用于迎宾机器人的行动动作。测评该系统能否能达到期望指标,识别能力强,正 确率高,鲁棒性好的语音识别系统。本专利技术是通过以下技术方案实现的,一种仿人机器人的语音识别系统,包括语音 输入模块、预处理模块、特征提取模块、训练模块、识别模块、识别决策模块、阈值比较模块, 语音输入模块的输出端与预处理模块的输入端连接,预处理模块的输出端与特征提取模块 的输入端连接,特征提取模块的输出端分别与训练模块、识别模块的输入端连接,训练模块 与识别模块连接;识别模块的输出端与识别决策模块的输入端连接,识别决策模块的输出 端与阈值比较模块的输入端连接。所述语音输入模块用于输入原始语音信号。所述预处理模块包括顺次连接的预滤波单元、采样与量化单元、预加重单元、加窗 单元、端点检测单元;所述预滤波单元用于去除原始语音信号的高频噪声;所述采样与量化单元采样奈奎斯特采样定理采样和量化去噪的模拟信号,获得数 字信号;所述预加重单元用于提升高频部分,让信号的频谱变得平坦,以便参数分析;所述加窗单元用于将信号有限化;所述端点检测单元用于检测语音段的起点、终点,去除不需要的静音段,提取试剂 的语音信号段。所述端点检测单元采用双门限能量法与人工神经网络相结合的方法。所述特征提取模块采用基于小波变换的混合特征参数提取算法,所述提取算法为 基于小波变换的线性预测倒谱参数和基于小波变换的Mel频率倒谱系数。所述训练模块是通过Baum-Welch (期望值修正)算法作为隐马尔科夫模型的训练 学习方法。所述识别决策模块是通过Viterbi (维特比)算法得到输出概率。所述阈值比较模块用于将获得的输出概率值与设定的阈值比较,如果高于阈值则 输出识别结果,否则丢弃该识别结果。本专利技术的工作过程语音信号从麦克风即语音输入模块输入信号,经预处理模块 预处理,预处理包括预滤波、采样与量化、预加重、加窗及端点检测;预处理后对信号进行特 征参数提取,将所提取的参数序列,建立保存成语音参数模板库即训练模板模块;语音识别 过程是语音从麦克风输入,经过预处理、特征参数提取,将提取的特征参数与所建立的语音 参数模板库进行概率计算与匹配,匹配得出结果通过阈值比较模块进行阈值比较,最终得 到识别结果。本专利技术中,计算概率后再进行一次阈值比较,若高于阈值者认为是正确识别结果, 否则,丢弃该识别结果,并提示“请再说一遍”语音后重新输入语音命令。阈值是一个经验 值,在特定的实验室环境下,经过多次实验而得出的值。附图说明图1语音识别系统框图2语音信号预处理框图3DWTM计算过程框图。具体实施方式为了更好的理解本专利技术,下面结合附图对本专利技术的实施例作详细说明本实施例 在以本专利技术技术方案为前提下进行实施,给出了详细的实施方式和具体操作过程,但本发 明的保护范围不限于下述的实施例。如图1所示,为本专利技术的系统框图,一种语音识别系统,包括语音输入模块、预处 理模块、特征提取模块、训练模块、识别模块、识别决策模块、阈值比较模块,语音输入模块 的输出端与预处理模块的输入端连接,预处理模块的输出端与特征提取模块的输入端连 接,特征提取模块的输出端分别与训练模块、识别模块的输入端连接,训练模块与识别模块 连接;识别模块的输出端与识别决策模块的输入端连接,识别决策模块的输出端与阈值比 较模块的输入端连接。所述语音输入模块用于输入原始语音信号。如图2所示所述预处理模块包括顺次连接的预滤波单元、采样与量化单元、预加 重单元、加窗单元、端点检测本文档来自技高网
...

【技术保护点】
一种语音识别系统,包括语音输入模块(1)、预处理模块(2)、特征提取模块(3)、训练模块(4)、识别模块(5),所述语音输入模块(1)的输出端与预处理模块(2)的输入端连接,预处理模块(2)的输出端与特征提取模块(3)的输入端连接,特征提取模块(3)的输出端分别与训练模块(4)、识别模块(5)的输入端连接,训练模块(4)与识别模块(5)连接;其特征在于还包括识别决策模块(6)、阈值比较模块(7),识别模块(5)的输出端与识别决策模块(6)的输入端连接,识别决策模块(6)的输出端与阈值比较模块(7)的输入端连接。

【技术特征摘要】
1.一种语音识别系统,包括语音输入模块(I)、预处理模块(2)、特征提取模块(3)、训练模块(4)、识别模块(5),所述语音输入模块(I)的输出端与预处理模块(2)的输入端连接,预处理模块(2)的输出端与特征提取模块(3)的输入端连接,特征提取模块(3)的输出端分别与训练模块(4)、识别模块(5)的输入端连接,训练模块(4)与识别模块(5)连接;其特征在于还包括识别决策模块¢)、阈值比较模块(7),识别模块(5)的输出端与识别决策模块(6)的输入端连接,识别决策模块(6)的输出端与阈值比较模块(7)的输入端连接。2.根据权利要求1所述语音识别系统,其特征在于所述语音输入模块(I)用于输入原始语首 目号。3.根据权利要求1所述语音识别系统,其特征在于所述预处理模块(2)包括顺次连接的预滤波单元、采样与量化单元、预加重单元、加窗单元、端点检测单元;所述预滤波单元用于去除原始语音信号的高频噪声;所述采样与量化单元采样奈奎斯特采样定理采样和量化去噪的模拟信号,获得数字信...

【专利技术属性】
技术研发人员:刘治林俊潜徐淑琼章云
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1