语音识别唤醒的方法、装置、终端设备及计算机可读介质制造方法及图纸

技术编号:33046324 阅读:27 留言:0更新日期:2022-04-15 09:30
本发明专利技术提供了一种语音识别唤醒的方法、终端设备、装置及存储介质,包括如下步骤:接收用户配置的任意定制唤醒关键词;接收输入的、意在唤醒终端设备的语音数据,将语音数据输入根据终端设备定制的深度学习网络模型,其中,深度学习网络模型为利用预先收集的音频数据预先训练好的深度学习网络模型;深度学习网络模型根据定制唤醒关键词对接收的语音数据进行处理,并输出唤醒结果。利用上述技术方案,不需要额外采集包含关键词的语音即可实现定制语音识别。音识别。音识别。

【技术实现步骤摘要】
语音识别唤醒的方法、装置、终端设备及计算机可读介质


[0001]本专利技术涉及人工智能领域,特别是涉及语音识别唤醒的方法、装置、终端设备及计算机可读介质。

技术介绍

[0002]具有语音识别功能的终端设备日益普及。一般来说,具有语音识别唤醒功能的终端设备在开启后,在语音交互上是处于休眠状态的。当用户说出指定唤醒词时,该设备就会被唤醒,从休眠状态切换到工作状态下,并等待用户接下来的指令。而当设备处于工作状态且空闲达预定的时间长度时,设备可以又从工作状态进入休眠状态,直到用户又通过语音唤醒设备。利用语音唤醒机制,设备不需要总是处于工作状态,从而节省能耗。语音唤醒的应用领域比较广泛,例如手机、可穿戴设备、智能家居等。不同的产品通常会有不同的唤醒词(例如苹果的“Hi,Siri”、阿里巴巴的“天猫精灵”)。各企业根据自身的特点定制不同的唤醒词。语音唤醒的实现方式也是多种多样的。目前,语音唤醒主要有以下三种实现方式:1.基于LVCSR(大规模词表连续语音识别)的方法;2.基于Keyword/Filler的方法;3.基于深度学习的方法。<br/>[0003]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别唤醒的方法,用于唤醒终端设备,其特征在于,包括如下步骤:接收用户配置的任意定制唤醒关键词;接收输入的、意在唤醒所述终端设备的语音数据,将所述语音数据输入根据所述终端设备定制的深度学习网络模型,其中,所述深度学习网络模型为利用预先收集的音频数据预先训练好的深度学习网络模型;所述深度学习网络模型根据所述定制唤醒关键词对所接收的语音数据进行处理,并输出唤醒结果。2.根据权利要求1所述的语音识别唤醒的方法,其特征在于,所述深度学习网络模型根据所述定制唤醒关键词对所接收的语音数据进行处理,并输出唤醒结果包括:提取所接收的语音数据的音频特征序列和对应的标签数据;将所述音频特征序列与所述定制唤醒关键词强制对齐;计算所述语音数据对应的损耗值;将所述损耗值与预先定义的唤醒词阈值进行比较;当所述损耗值小于所述唤醒词阈值时,唤醒所述终端设备;否则,不唤醒所述终端设备。3.根据权利要求2所述的方法,其特征在于,所述定制的深度学习网络模型由注意力模型Attention和连接时序分类CTC结合组成。4.根据权利要求3所述的方法,其特征在于,所述定制深度学习网络模型使用所述注意力模型Attention中的编码器Encoder。5.根据权利要求4所述的方法,其特征在于,利用所述预先收集的音频数据对所述深度学习网络模型进行训练包括:所述Attention的编码器Encoder提取所述预先收集的音频数据的音频特征序列...

【专利技术属性】
技术研发人员:杨洪肖龙源李稀敏叶志坚
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1