一种语音唤醒模块的实现方法及应用技术

技术编号：8489475 阅读：415 留言：0更新日期：2013-03-28 08:09

一种语音唤醒模块的实现方法及应用，包括：语音输入(1)、语音唤醒算法(2)和唤醒执行(3)；语音唤醒算法(2)实现主要通过声学特征提取(4)、唤醒词检测(5)、唤醒词确认(6)、构建唤醒词检测网络(7)、训练声学模型(8)和构建唤醒词确认网络(9)等实现。本发明专利技术即使在嘈杂环境下不论是否有播放音乐，都可以通过语音唤醒词开启语音唤醒功能，识别唤醒效果好；本发明专利技术的实现方法能够被移植到ARM或DSP通用处理器上运行，应用于车载及家电相关领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音唤醒模块的实现方法及应用
本专利技术公开了一种语音唤醒模块的实现方法及应用，具体涉及一种通过用户说预定的语音唤醒词来触发系统执行用户下一步操作，可以应用与需要实现语音唤醒的车载及家电等领域。
技术介绍
本专利技术涉及到一项已申请公开的专利技术专利，公开号为CN102645977A，申请日为 2012. 03. 26，专利技术人是殷建红、王忠、周彦煌，名称为“一种车载语音唤醒人机交互系统及方法”，在此将其引为参考文献。该专利技术的车载语音唤醒实现原理是在预先设置的flash 存储器中存放语音库、车载噪音库、语音引擎等信息，通过麦克风输入的语音指令经由主控制器MCU与存储器存储的语音指令相关信息进行比对进行语音识别，并将比对识别后确定的语音指令相关信息作为执行指令控制车载控制功能单元模块，实现其相应的功能。该发明中所涉及到的flash存放的都是固定的数据，而车载环境下，由于行车速度、路况、天气、是否开空调开窗户都会导致发动机噪声和轮胎噪声等车载噪声库变化，车内播放的音乐不同，发音人的不同会导致所参考的语音库发生变化，所以该专利技术仅适用于固定的场景下实现语音唤醒功能。而本专利技术通过采集各类场景下不同发音人录音数据，训练出一种声学模型，同时通过构建唤醒词检测网络及确认网络，使得本专利技术适应场景更广泛，同时语音唤醒效果好。
技术实现思路
本专利技术的目的是为了解决现有技术的不足，提供一种语音唤醒系统的实现方法，即使在嘈杂环境下不论是否有播放音乐，都可以通过语音唤醒词开启语音唤醒功能，同时语音唤醒效果好；此外本专利技术还提供语音唤醒...

【技术保护点】
一种语音唤醒模块的实现方法，其特征在于包括：语音输入(1)、语音唤醒算法(2)和唤醒执行(3)步骤，语音唤醒算法(2)获取语音输入(1)的语音信号，进行语音唤醒处理后，将结果输出给唤醒执行(3)，从而完成唤醒操作；所述语音唤醒算法(2)通过声学特征提取(4)、唤醒词检测(5)、唤醒词确认(6)、构建唤醒词检测网络(7)、训练声学模型(8)和构建唤醒词确认网络(9)来实现，具体实现过程如下：第一步，声学特征提取(4)：通过语音输入(1)获取语音信号输入，提取具有区分性的、并且是基于人耳听觉特性提取的特征，通常选取语音识别中用到的MFCC(Mel?Frequency?Cepstrum?Coefficient，美尔频率倒谱系数)特征作为声学特征；第二步，唤醒词检测(5)：将提取得到的声学特征，采用训练的声学模型(8)在唤醒词检测网络(7)上计算声学得分，如果声学得分最优的路径中包含要检测的唤醒词，则确定已检出唤醒词，进入第三步操作，否则回到第一步重新进行提取声学特征(4)步骤；第三步，唤醒词确认(6)：将提取得到的声学特征，采用训练的声学模型(8)在唤醒词确认网络(9)上进行唤醒词确认，得到...

【技术特征摘要】

【专利技术属性】
技术研发人员：操文祥，王海坤，康怀茂，钱勇，谢信珍，黄海兵，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人