一种语音控制方法、装置、设备及存储介质制造方法及图纸

技术编号：21118010 阅读：21 留言：0更新日期：2019-05-16 09:41

本发明专利技术实施例提出一种语音控制方法、装置、设备及存储介质，其中方法包括：检测语音信息的前多个音节中是否包含唤醒关键词；如果包含，则对所述语音信息进行语音识别，得到所述语音信息对应的文本信息；针对所述文本信息执行对应的操作。本发明专利技术实施例能够简化与语音交互设备的交互流程，提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音控制方法、装置、设备及存储介质
本专利技术涉及语音交互
，尤其涉及一种语音控制方法、装置、设备及存储介质。
技术介绍
现有的语音交互技术中，用户在使用语音交互设备时，需要首先说出固定的唤醒词来唤醒设备，等待设备播报唤醒成功的提示后，再说出包含需求的语音指令。例如，某语音交互设备的唤醒词为“小A小A”。当用户需要语音交互设备播放音乐时，首先说出“小A小A”，等待语音交互设备播放“我来了”的语音信息。之后，用户再说出“我要听音乐”，语音交互设备对接收的语音信息进行语音识别，得到对应的文本信息，并针对该文本信息执行相应的操作。可见，现有的语音交互方式中，用户每发出一次指令都需要两轮交互。并且，用户需要掌握唤醒词并了解语音交互设备何时被唤醒成功，在等待唤醒成功的提示之后再说出相应的指令。这种方式费时费力，导致用户体验较差。
技术实现思路
本专利技术实施例提供一种语音控制方法及装置，以至少解决现有技术中的以上技术问题。第一方面，本专利技术实施例提供了一种语音控制方法，包括：检测语音信息的前多个音节中是否包含唤醒关键词；如果包含，则对所述语音信息进行语音识别，得到所述语音信息对应的文本信息；针对所述文本信息执行对应的操作。在一种实施方式中，所述检测语音信息的前多个音节中是否包含唤醒关键词，包括：采用预先设置的针对多个唤醒关键词的语音唤醒模型，检测所述语音信息的前多个音节中是否包含所述多个唤醒关键词中的任意一个唤醒关键词，如果是，则判定所述语音信息的前多个音节中包含唤醒关键词。在一种实施方式中，所述针对所述文本信息执行相应的处理，包括：判断所述文本信息是否为指...

【技术保护点】
1.一种语音控制方法，其特征在于，包括：检测语音信息的前多个音节中是否包含唤醒关键词；如果包含，则对所述语音信息进行语音识别，得到所述语音信息对应的文本信息；针对所述文本信息执行对应的操作。

【技术特征摘要】
1.一种语音控制方法，其特征在于，包括：检测语音信息的前多个音节中是否包含唤醒关键词；如果包含，则对所述语音信息进行语音识别，得到所述语音信息对应的文本信息；针对所述文本信息执行对应的操作。2.根据权利要求1所述的方法，其特征在于，所述检测语音信息的前多个音节中是否包含唤醒关键词，包括：采用预先设置的针对多个唤醒关键词的语音唤醒模型，检测所述语音信息的前多个音节中是否包含所述多个唤醒关键词中的任意一个唤醒关键词，如果是，则判定所述语音信息的前多个音节中包含唤醒关键词。3.根据权利要求1或2所述的方法，其特征在于，所述针对所述文本信息执行相应的处理，包括：判断所述文本信息是否为指令信息；如果是，则针对所述文本信息执行对应的操作。4.根据权利要求3所述的方法，其特征在于，所述判断所述文本信息是否为指令信息，包括：根据预设的唤醒关键词与指令判断策略的对应关系，获取所述语音信息中包含的唤醒关键词所对应的指令判断策略；采用获取的指令判断策略判断所述文本信息是否为指令信息。5.根据权利要求2所述的方法，其特征在于，所述语音唤醒模型设置于本地装置。6.根据权利要求1所述的方法，其特征在于，所述对所述语音信息进行语音识别，包括：采用设置于本地装置的语音识别模型对所述语音信息进行语音识别；或者，将所述语音信息发送至云端服务器，采用设置于云端服务器的语音识别模型对所述语音信息进行语音识别。7.一种语音控制装置，其特征在于，包括：检测模块，用于检测语音信息的前多个音节中是否包含唤醒关键词；如果包含，则指示识别模块进行识别；所述识别模块，用于根据所述检测模块的指示，对所述语音信息进行语音识别，得到所述语音信息...

【专利技术属性】
技术研发人员：唐丹丹，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人