一种语音处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24462196 阅读:34 留言:0更新日期:2020-06-10 17:21
本发明专利技术公开了一种语音处理方法、装置、电子设备及存储介质,所述方法包括:电子设备接收唤醒语音输入;如果从唤醒语音中识别到第一唤醒词,接收后续输入的控制语音,将控制语音发送给第一服务器,使第一服务器识别控制语音对应电子设备的第一控制指令并返回;电子设备执行第一控制指令;如果从唤醒语音中识别到第二唤醒词,接收后续输入的控制语音,将控制语音发送给第二服务器,使第二服务器基于第三方设备的控制特征词集,确定控制语音对应的目标第三方设备,识别控制语音对应目标第三方设备的第二控制指令并返回;电子设备将第二控制指令发送给目标第三方设备,使目标第三方设备执行第二控制指令。用以提高语音控制的准确性,提高用户体验。

A speech processing method, device, electronic equipment and storage medium

【技术实现步骤摘要】
一种语音处理方法、装置、电子设备及存储介质
本专利技术涉及人工智能领域,尤其涉及一种语音处理方法、装置、电子设备及存储介质。
技术介绍
随着互联网技术的不断发展,智能硬件应运而生。智能硬件是通过软件和硬件结合的方式,对传统设备进行改造,进而让传统设备拥有智能化的功能。智能化后的设备,即智能硬件也可以称为智能设备,具备连接互联网的能力,形成“云+端”的典型架构,具有更加的附加价值。为了便于用户的使用,越来越多的智能设备都在向语音交互的方向发展,在智能设备对输入的语音进行处理时,通常需要先对语音进行语音识别(AutomaticSpeechRecognition,ASR)处理,将输入的语音转换为文本,再对文本信息进行语义分析和反馈(NaturalLanguageProcessing,NLP)处理,以理解用户语音对应的语义,并根据用户的语义给出对应的反馈。然而,现有技术中在用户通过智能设备进行语音控制时,智能设备并不能准确的识别出用户需要控制的设备,影响了用户的体验。
技术实现思路
本专利技术提供一种语音处理方法、装置、电子设备及存储介质,用以解决现有技术中存在通过智能设备进行语音控制不准确的问题。第一方面,本专利技术公开了一种语音处理方法,应用于电子设备,所述方法包括:接收唤醒语音输入;如果从所述唤醒语音中识别到第一唤醒词,接收后续输入的控制语音,将所述控制语音发送给第一服务器,使所述第一服务器识别所述控制语音对应所述电子设备的第一控制指令并返回;执行所述第一控制指令;如果从所述唤醒语音中识别到第二唤醒词,接收后续输入的控制语音,将所述控制语音发送给第二服务器,使所述第二服务器基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备,识别所述控制语音对应所述目标第三方设备的第二控制指令并返回;将所述第二控制指令发送给所述目标第三方设备,使所述目标第三方设备执行所述第二控制指令。在一个可选的设计中,所述基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备包括:基于所述第三方设备的控制特征词集,识别所述控制语音中包含的目标控制特征词;根据每个第三方设备与所述第三方设备的控制特征词集中控制特征词的映射关系,确定与所述目标控制特征词存在映射关系的目标第三方设备。在一个可选的设计中,如果未从所述唤醒语音中识别到唤醒词,所述方法还包括:接收后续输入的对话语音,将所述对话语音发送给第三服务器,使所述第三服务器将所述对话语音转换为对话文本,对所述对话文本进行解析生成应答结果,并将所述应答结果转换为应答语音发送给所述电子设备;接收所述第三服务器发送的所述应答语音并播放。在一个可选的设计中,如果所述第三服务器中预先设置有与所述电子设备对应的优先识别的热词,所述第三服务器将所述对话语音转换为对话文本包括:所述第三服务器基于所述优先识别的热词,将所述对话语音转换为对话文本。在一个可选的设计中,如果所述第三服务器中预先设置有与所述电子设备对应的用户信息,所述将所述应答结果转换为应答语音包括:根据所述用户信息,选择与所述用户信息对应的从文本到语音TTS引擎,将所述应答结果转换为应答语音,其中所述用户信息包括:年龄、地区和性别中的至少一种。在一个可选的设计中,所述将所述对话语音发送给第三服务器之后,所述方法还包括:接收所述第三服务器发送的所述对话语音中包含敏感词的提示语音并播放;其中,所述提示语音为所述第三服务器在检测到所述对话语音中包含预设的敏感词后发送的。第二方面,本专利技术公开了一种语音处理装置,应用于电子设备,所述装置包括:接收模块,用于接收唤醒语音输入;处理模块,用于如果从所述唤醒语音中识别到第一唤醒词,接收后续输入的控制语音,将所述控制语音发送给第一服务器,使所述第一服务器识别所述控制语音对应所述电子设备的第一控制指令并返回;执行所述第一控制指令;所述处理模块,还用于如果从所述唤醒语音中识别到第二唤醒词,接收后续输入的控制语音,将所述控制语音发送给第二服务器,使所述第二服务器基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备,识别所述控制语音对应所述目标第三方设备的第二控制指令并返回;将所述第二控制指令发送给所述目标第三方设备,使所述目标第三方设备执行所述第二控制指令。第三方面,本专利技术公开了一种电子设备,包括:存储器、处理器和收发机;所述处理器,用于读取存储器中的程序,执行下列过程:接收唤醒语音输入;如果从所述唤醒语音中识别到第一唤醒词,接收后续输入的控制语音,通过收发机将所述控制语音发送给第一服务器,使所述第一服务器识别所述控制语音对应所述电子设备的第一控制指令并返回;执行所述第一控制指令;如果从所述唤醒语音中识别到第二唤醒词,接收后续输入的控制语音,通过收发机将所述控制语音发送给第二服务器,使所述第二服务器基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备,识别所述控制语音对应所述目标第三方设备的第二控制指令并返回;将所述第二控制指令发送给所述目标第三方设备,使所述目标第三方设备执行所述第二控制指令。在一个可选的设计中,所述基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备包括:基于所述第三方设备的控制特征词集,识别所述控制语音中包含的目标控制特征词;根据每个第三方设备与所述第三方设备的控制特征词集中控制特征词的映射关系,确定与所述目标控制特征词存在映射关系的目标第三方设备。在一个可选的设计中,所述处理器,还用于接收后续输入的对话语音,通过收发机将所述对话语音发送给第三服务器,使所述第三服务器将所述对话语音转换为对话文本,对所述对话文本进行解析生成应答结果,并将所述应答结果转换为应答语音发送给所述电子设备;接收所述第三服务器发送的所述应答语音并播放。在一个可选的设计中,如果所述第三服务器中预先设置有与所述电子设备对应的优先识别的热词,所述第三服务器将所述对话语音转换为对话文本包括:所述第三服务器基于所述优先识别的热词,将所述对话语音转换为对话文本。在一个可选的设计中,如果所述第三服务器中预先设置有与所述电子设备对应的用户信息,所述将所述应答结果转换为应答语音包括:根据所述用户信息,选择与所述用户信息对应的从文本到语音TTS引擎,将所述应答结果转换为应答语音,其中所述用户信息包括:年龄、地区和性别中的至少一种。在一个可选的设计中,所述处理器,还用于通过收发机接收所述第三服务器发送的所述对话语音中包含敏感词的提示语音并播放;其中,所述提示语音为所述第三服务器在检测到所述对话语音中包含预设的敏感词后发送的。第四方面,本专利技术公开了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口、存储器通过通信总线完成相互间的通信;所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述第本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,应用于电子设备,所述方法包括:/n接收唤醒语音输入;/n如果从所述唤醒语音中识别到第一唤醒词,接收后续输入的控制语音,将所述控制语音发送给第一服务器,使所述第一服务器识别所述控制语音对应所述电子设备的第一控制指令并返回;执行所述第一控制指令;/n如果从所述唤醒语音中识别到第二唤醒词,接收后续输入的控制语音,将所述控制语音发送给第二服务器,使所述第二服务器基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备,识别所述控制语音对应所述目标第三方设备的第二控制指令并返回;将所述第二控制指令发送给所述目标第三方设备,使所述目标第三方设备执行所述第二控制指令。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,应用于电子设备,所述方法包括:
接收唤醒语音输入;
如果从所述唤醒语音中识别到第一唤醒词,接收后续输入的控制语音,将所述控制语音发送给第一服务器,使所述第一服务器识别所述控制语音对应所述电子设备的第一控制指令并返回;执行所述第一控制指令;
如果从所述唤醒语音中识别到第二唤醒词,接收后续输入的控制语音,将所述控制语音发送给第二服务器,使所述第二服务器基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备,识别所述控制语音对应所述目标第三方设备的第二控制指令并返回;将所述第二控制指令发送给所述目标第三方设备,使所述目标第三方设备执行所述第二控制指令。


2.如权利要求1所述的方法,其特征在于,所述基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备包括:
基于所述第三方设备的控制特征词集,识别所述控制语音中包含的目标控制特征词;
根据每个第三方设备与所述第三方设备的控制特征词集中控制特征词的映射关系,确定与所述目标控制特征词存在映射关系的目标第三方设备。


3.如权利要求1所述的方法,其特征在于,如果未从所述唤醒语音中识别到唤醒词,所述方法还包括:
接收后续输入的对话语音,将所述对话语音发送给第三服务器,使所述第三服务器将所述对话语音转换为对话文本,对所述对话文本进行解析生成应答结果,并将所述应答结果转换为应答语音发送给所述电子设备;
接收所述第三服务器发送的所述应答语音并播放。


4.如权利要求3所述的方法,其特征在于,如果所述第三服务器中预先设置有与所述电子设备对应的优先识别的热词,所述第三服务器将所述对话语音转换为对话文本包括:
所述第三服务器基于所述优先识别的热词,将所述对话语音转换为对话文本。


5.如权利要求3所述的方法,其特征在于,如果所述第三服务器中预先设置有与所述电子设备对应的用户信息,所述将所述应答结果转换为应答语音包括:
根据所述用户信息,选择与所述用户信息对应的从文本到语音TTS引擎,将所述应答结果转换为应答语音,其中所述用户信息包括:年龄、地区和性别中的至少一种。


6.如权利要求3所述的方法,其特征在于,所述将所述对话语音发送给第三服务器之后,所述方法还包括:
接收所述第三服务器发送的所述对话语音中包含敏感词的提示语音并播放;其中,所述提示语音为所述第三服务器在检测到所述对话语音中包含预设的敏感词后发送的。


7.一种语音处理装置,其特征在于,应用于电子设备,所述装置包括:
接收模块,用于接收唤醒语音输入;
处理模块,用于如果从所述唤醒语音中识别到第一唤醒词,接收后续输入的控制语音,将所述控制语音发送给第一服务器,使所述第一服务器识别所述控制语音对应所述电子设备的第一控制指令并返回;执行所述第一控制指令;
所述处理模块,还用于如果从所述唤醒语音中识别到第二唤醒词,接收后续输入的控制语音,将所述控制语音发送给第二服务器,使所述第二服务器基于第三方设备的控制特征词集,确定所述控制语音对应的目标第三方设备,识别所述控制语音对应所述目标第三方设备的第二控制指令并...

【专利技术属性】
技术研发人员:杨一帆徐运曹轲罗红
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1