语音唤醒方法和装置制造方法及图纸

技术编号：29529167 阅读：34 留言：0更新日期：2021-08-03 15:16

本发明专利技术公开语音唤醒方法和装置，其中，一种语音唤醒方法，包括：响应于获取到语音信息，将语音信息送入唤醒模型进行第一得分计算，判断第一得分是否大于等于唤醒模型预设的唤醒阈值；若第一得分大于等于唤醒模型预设的唤醒阈值，将语音信息送入本地离线识别模型进行第二得分计算，判断第二得分是否大于等于本地离线识别模型预设的唤醒阈值；若第二得分大于等于本地离线识别模型预设的唤醒阈值，将设备唤醒与用户进行交互。通过将第一得分大于等于唤醒模型的预设唤醒阈值的语音信息送入本地离线识别模型进行第二得分计算，从而可以使唤醒更加准确、减少误唤醒，进一步地，使用本地离线识别模型从而可以更加快速的进行识别，减少识别延迟。

全部详细技术资料下载

【技术实现步骤摘要】
语音唤醒方法和装置
本专利技术属于语音数据处理
，尤其涉及语音唤醒方法和装置。
技术介绍
在现有的语音交互类产品中，产品基本上都会预设一个唤醒词，但真实的用户都希望能够自己定义唤醒词内容。已有的自定义唤醒技术方案中均是通过在一个比较大的唤醒模型中配置唤醒词完成自定义唤醒功能的，其中该通用模型的分类节点是包含所有的音素建模单元。同时为了降低误唤醒问题，现有的有些技术中会采取声学特征和模板特征比对，比对的置信度超过阈值才会将语音数据送入通用的唤醒引擎。在相似的技术中要实现自定义唤醒词，第一步需要将唤醒词对应的文字转为唤醒模型对应的建模单元，可以是拼音也可以是音素，具体要看实际系统中的建模单元是哪一种；接下来需要计算唤醒词阈值；最后将转换后的信息以及对应的阈值配置进入唤醒引擎中。在实际使用的过程中如果语音信息通过模型计算超过阈值即可认为是被唤醒。在有些方案中，为了降低误唤醒，会在唤醒模型前增加一个声学特征比对的过程。只有超过声学特征比对的语音才会进入唤醒模型进行计算。由于自定义唤醒词需要实时生效，因此并不可能...

【技术保护点】
1.一种语音唤醒方法，包括：/n响应于获取到语音信息，将所述语音信息送入唤醒模型进行第一得分计算，判断所述第一得分是否大于等于所述唤醒模型预设的唤醒阈值；/n若所述第一得分大于等于所述唤醒模型预设的唤醒阈值，将所述语音信息送入本地离线识别模型进行第二得分计算，判断所述第二得分是否大于等于所述本地离线识别模型预设的唤醒阈值；/n若所述第二得分大于等于所述本地离线识别模型预设的唤醒阈值，将设备唤醒与用户进行交互。/n

【技术特征摘要】
1.一种语音唤醒方法，包括：
响应于获取到语音信息，将所述语音信息送入唤醒模型进行第一得分计算，判断所述第一得分是否大于等于所述唤醒模型预设的唤醒阈值；
若所述第一得分大于等于所述唤醒模型预设的唤醒阈值，将所述语音信息送入本地离线识别模型进行第二得分计算，判断所述第二得分是否大于等于所述本地离线识别模型预设的唤醒阈值；
若所述第二得分大于等于所述本地离线识别模型预设的唤醒阈值，将设备唤醒与用户进行交互。

2.根据权利要求1所述的方法，其中，在所述判断所述第二得分是否大于等于所述本地离线识别模型预设的唤醒阈值之后，还包括：
若所述第一得分小于所述唤醒模型预设的唤醒阈值或第二得分小于所述本地离线识别模型预设的唤醒阈值，判定设备不唤醒。

3.根据权利要求1所述的方法，其中，在所述响应于获取到语音信息，将所述语音信息送入唤醒模型进行第一得分计算，判断所述第一得分是否大于等于所述唤醒模型预设的唤醒阈值之前，还包括：
响应于获取到用户的注册指令，获取所述用户输入的自定义唤醒词；
基于所述用户输入的自定义唤醒词，将所述自定义唤醒词转换为能够配置进入所述唤醒模型和所述本地离线识别模型的信息并配置进入所述唤醒模型和所述本地离线识别模型。

4.根据权利要求1所述的方法，其中，所述本地离线识别模型使用大量的非固定领域的通用文本和语料进行训练。

5.根据权利要求4所述的方法，其中，所述本地离线识别模型的二次校验框架包括：基于grammar的识别系统和/或深度学习的端到端的识别系统，其中，所述grammar的识别...

【专利技术属性】
技术研发人员：陈明佳，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人