语音唤醒方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：24097233 阅读：25 留言：0更新日期：2020-05-09 11:00

本申请揭示了一种语音唤醒方法、装置、计算机设备和存储介质，方法包括：当接收到输入的语音数据片段时，调用与自定义唤醒词中所有唤醒字的数量相同的预设的多个指定单字模型，对所述语音数据片段进行唤醒判别处理，得到所述语音数据片段的唤醒判别结果，其中，所述唤醒字与所述指定单字模型之间具有一一对应的关系，所述唤醒判别结果包括唤醒判别通过或唤醒判别不通过；当所述判别结果为唤醒判别通过时，执行对应的唤醒操作，而所述判别结果为唤醒判别不通过时，限制执行唤醒操作。通过本申请，用户可以实现通过输入任意一个自定义唤醒词对应的语音数据来完成对于终端的唤醒，有效地提高了终端的唤醒智能性，以及提高了用户的使用体验。

Voice wake-up method, device, computer equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
语音唤醒方法、装置、计算机设备和存储介质
本申请涉及语音识别
，具体涉及一种语音唤醒方法、装置、计算机设备和存储介质。
技术介绍
随着信息技术的发展，语音识别技术也随之发展，利用语音识别的产品越来越多，例如，会话助理、智能机器人、智能手表等。这些产品都是通过语音识别来增强用户体验和提高自然人机交互的水平，且通常这些产品也需要通过语音唤醒来开启工作。语音唤醒技术是一种具有开关入口属性的功能。用户通过语音唤醒，可以发起人机交互的操作，即机器只有被用户所说的特定唤醒词成功唤醒后，才会对用户接下来的语音指令进行识别。相关技术中存在一些语音唤醒技术，但都存在一定的问题，比如唤醒词数量仅为一个且无法更改，例如常见的有小米公司所使用的小爱同学，这样造成机器的唤醒智能性较低，用户的使用体验感不好。
技术实现思路
本申请的主要目的为提供一种语音唤醒方法、装置、计算机设备和存储介质，旨在解决现有的语音唤醒技术的唤醒词数量仅为一个且无法更改，造成机器的唤醒智能性较低的技术问题。本申请提出一种语音唤...

【技术保护点】
1.一种语音唤醒方法，其特征在于，包括：/n当接收到输入的语音数据片段时，调用与自定义唤醒词中所有唤醒字的数量相同的预设的多个指定单字模型，对所述语音数据片段进行唤醒判别处理，得到所述语音数据片段的唤醒判别结果，其中，所述唤醒字与所述指定单字模型之间具有一一对应的关系，所述唤醒判别结果包括唤醒判别通过或唤醒判别不通过；/n当所述唤醒判别结果为唤醒判别通过时，执行对应的唤醒操作，否则限制执行所述唤醒操作。/n

【技术特征摘要】
1.一种语音唤醒方法，其特征在于，包括：
当接收到输入的语音数据片段时，调用与自定义唤醒词中所有唤醒字的数量相同的预设的多个指定单字模型，对所述语音数据片段进行唤醒判别处理，得到所述语音数据片段的唤醒判别结果，其中，所述唤醒字与所述指定单字模型之间具有一一对应的关系，所述唤醒判别结果包括唤醒判别通过或唤醒判别不通过；
当所述唤醒判别结果为唤醒判别通过时，执行对应的唤醒操作，否则限制执行所述唤醒操作。

2.根据权利要求1所述的语音唤醒方法，其特征在于，所述当接收到输入的语音数据片段时，调用与自定义唤醒词中所有唤醒字的数量相同的预设的多个指定单字模型，对所述语音数据片段进行唤醒判别处理，得到所述语音数据片段的唤醒判别结果的步骤之前，包括：
获取输入的常见唤醒字；以及，
获取与所有所述常见唤醒字的数量相同的多段常见唤醒字音频，其中，所述常见唤醒字与所述常见唤醒字音频之间具有一一对应的关系；
提取出与特定唤醒字对应的特定唤醒字音频，使用所述特定唤醒字对所述特定唤醒字音频进行标注，得到对应的特定标注音频数据，并使用所述特定标注音频数据对原始的语音识别模型进行训练以得到特定单字模型，其中，所述特定唤醒字为所有所述常见唤醒字中的任意一个常见唤醒字；
依次类推，在得到了与所有所述常见唤醒字的数量相同的多个单字模型后，将所有所述单字模型存储于预创建的常见字模型库内，其中，所述常见唤醒字与所述单字模型之间具有一一对应的关系。

3.根据权利要求2所述的语音唤醒方法，其特征在于，所述当接收到输入的语音数据片段时，调用与自定义唤醒词中所有唤醒字的数量相同的预设的多个指定单字模型，对所述语音数据片段进行唤醒判别处理，得到所述语音数据片段的唤醒判别结果的步骤，包括：
获取输入的自定义唤醒词；
从所述自定义唤醒词中依次提取出组成所述自定义唤醒词的多个唤醒字；
根据每个所述唤醒字在所述自定义唤醒词中的文字先后排序顺序，依次从所述常见字模型库中分别筛选出与每个所述唤醒字一一对应的一个指定单字模型；
根据各所述指定单字模型的筛选先后顺序，通过所述多个指定单字模型对接收到的所述语音数据片段进行唤醒判别，得到所述语音数据片段的唤醒判别结果。

4.根据权利要求3所述的语音唤醒方法，其特征在于，所述根据各所述指定单字模型的筛选先后顺序，通过所述多个指定单字模型对所述语音数据片段进行唤醒判别，得到所述语音数据片段的唤醒判别结果的步骤，包括：
获取实时输入的第一语音数据片段；
根据各所述指定单字模型的筛选先后顺序，将所述第一语音数据片段输入至预设的第一单字模型进行唤醒判别，得到第一单字判别结果，其中，所述第一单字模型在所有指定单字模型中的筛选先后顺序为排序第一的模型；
若所述第一单字判别结果为不通过，则生成唤醒判别不通过的第一唤醒判别结果，并生成重新输入用于由所述第一单字模型进行唤醒判别的指定语音数据的提醒信息，以及停止执行除所述第一单字模型外的其他指定单字模型的模型输入操作；
若所述第一单字判别结果为通过，获取实时输入的第二语音数据片段；
将所述第二语音数据片段输入至预设的第二单字模型进行唤醒判别，得到第二单字判别结果，并根据第二单字判别结果生成唤醒判别不通过的第二唤醒判别结果，或者继续执行将实时输入的第三语音数据片段输入至预设的第三单字模型的模型输入操作，其中，所述第二单字模型在所有指定单字模型中的筛选先后顺序为...

【专利技术属性】
技术研发人员：徐泓洋，王广新，杨汉丹，
申请(专利权)人：深圳市友杰智新科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人