语音唤醒方法及语音交互装置制造方法及图纸

技术编号：14708282 阅读：83 留言：0更新日期：2017-02-26 00:18

本发明专利技术实施例提供一种语音唤醒方法及语音交互装置，其中，该方法包括：接收语音输入信号；根据第一声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第一相似度，并判断所述第一相似度是否超过第一预设阈值；若超过，则根据第二声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第二相似度，并判断所述第二相似度是否超过第二预设阈值，若超过，则唤醒语音交互功能，其中，所述第二声学模型的准确度高于所述第一声学模型的准确度。本发明专利技术实施例提供的语音唤醒方法及语音交互装置能够兼顾低功耗功耗和低误唤醒率的需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及语音识别
，尤其涉及一种语音唤醒方法及语音交互装置。
技术介绍
随着语音识别技术的飞速发展,语音交互的应用场景越来越普遍,智能电视,智能车载,智能家居,智能机器人都是语音交互应用的主要应用场景,同时由于人机交互对于用户体验的要求越来越高,人机语音对话的距离也越来越不局限于近讲(50cm以内)。现在通过多麦克风技术,已经能够实现3-5米内的远距离语音交互。与此同时,远距离语音交互还存在一个问题,就是什么时候开始触发语音收音并且开始识别。目前的技术方案有两种,一种是用一颗低功耗芯片,一直通过麦克风阵列收音,做相应的信号处理后(信号增强,噪声抑制,回声消除),然后再做语音识别,判断用户是否说出唤醒词,如果说了,则通知主模块,开始收音并进行语音识别,还有一种方式是前端的模块只做信号处理,由主模块来一直收音,并做语音识别来判断用户是否说出唤醒词,但是这两种方式都有弊端,前一种方式由于前端处理模块要求低功耗,所以识别性能相对来说会较低,同时误唤醒率也会较高；而后一种方案的问题是主芯片模块需要一直全速运行,功耗会比较大，并且由于对主芯片模块的要求比较高，方案的成本也比较高。目前尚无兼顾功耗和误唤醒率的方案。
技术实现思路
本专利技术实施例提供一种语音唤醒方法及语音交互装置，用以解决现有技术无法兼顾功耗和误唤醒率的问题。本专利技术实施例第一方面提供一种语音唤醒方法，该方法包括：接收语音输入信号；根据第一声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第一相似度，并判断所述第一相似度是否超过第一预设阈值；若超过，则根据第二声学模型，确定所述语...
语音唤醒方法及语音交互装置

【技术保护点】
一种语音唤醒方法，其特征在于，包括：接收语音输入信号；根据第一声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第一相似度，并判断所述第一相似度是否超过第一预设阈值；若超过，则根据第二声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第二相似度，并判断所述第二相似度是否超过第二预设阈值，其中，所述第二声学模型的准确度高于所述第一声学模型的准确度；若超过，则唤醒语音交互功能。

【技术特征摘要】
1.一种语音唤醒方法，其特征在于，包括：接收语音输入信号；根据第一声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第一相似度，并判断所述第一相似度是否超过第一预设阈值；若超过，则根据第二声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第二相似度，并判断所述第二相似度是否超过第二预设阈值，其中，所述第二声学模型的准确度高于所述第一声学模型的准确度；若超过，则唤醒语音交互功能。2.根据权利要求1所述的方法，其特征在于，所述第二预设阈值大于所述第一预设阈值。3.根据权利要求2所述的方法，其特征在于，所述根据第一声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第一相似度，包括：从所述语音输入信号中，提取特征信号；根据第一声学模型和所述特征信号，确定所述特征信号和预设的唤醒语音信号之间的第一极大似然值；根据所述第一极大似然值，确定所述语音输入信号与预设的唤醒语音信号之间的第一相似度。4.根据权利要求3所述的方法，其特征在于，当所述第一相似度超过所述第一预设阈值时，所述根据第二声学模型，确定所述语音输入信号和预设的唤醒语音信号之间的第二相似度，包括：根据所述第二声学模型，确定所述特征信号中发音单元与其前和/或后发音单元之间的第一转移概率，以及对应的所述唤醒语音信号中发音单元与其前和/或后发音单元之间的第二转移概率；根据所述第一转移概率和所述第二转移概率，确定所述特征信号和所述唤醒语音信号之间的第二相似度。5.根据权利要求1～4任一项所述的方法，其特征在于，所述第一声学模型设置在DSP模块中，所述的第二声学模型设置在主芯片处理模块中。6....

【专利技术属性】
技术研发人员：杨香斌，
申请(专利权)人：海信集团有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人