【技术实现步骤摘要】
语音交互设备和系统、设备控制方法、计算设备以及介质
本公开涉及一种语音交互领域,特别涉及通过语音控制设备的语音交互设备、语音交互系统以及设备控制方法。
技术介绍
随着物联网的普及与发展,业已实现用语音对各类物联网设备进行控制。一般地,终端的语音交互设备将所接收到的语音上传到云端,借助云端强大的处理能力进行语音识别和自然语言理解。物联网服务器根据自然语言理解的结果生成控制指令下发到相应的物联网设备。用户说话的同时,语音交互设备可以将音频文件上传到云端,通过云端自动语音识别(ASR)引擎识别并输出文本。然而,在用户说完话后,语音交互设备需要经过算法判断用户是否说完话。一般地,语音交互设备会等待1秒左右,然后闭麦,即关闭麦克风。然后,将云端ASR文本输出到云端自然语言理解(NLU)引擎,输出自然语言处理(NLP)信息。在用户的语音涉及物联网设备控制时,云端将NLP信息发送到物联网IOT服务端。IOT服务端进行指令封装,并向对应的物联网设备下发控制指令。然而,云端ASR引擎对音频文件的解析存在耗时情况,端上等待云端ASR的文本输出也需要等待时间,同时还需要有网络开销。另外,IOT设备控制也需要经过IOT服务,这个过程中链路上应用比较多,中间各应用也会耗时。这样,当通过语音交互设备控制IOT设备时,响应往往比较慢。因此,需要一种新的语音交互方案,以提升响应速度,改善用户体验。
技术实现思路
本专利技术所要解决的技术问题是提供一种语音交互 ...
【技术保护点】
1.一种语音交互设备,其特征在于,包括:/n存储模块,用于存储一个或多个设备的设备信息;/n语音交互模块,用于与用户进行语音交互;/n语音处理模块,用于从所述语音交互模块接收到的语音中识别实体信息和意图信息;以及/n设备管理模块,用于根据所述存储模块存储的设备信息,向与所述实体信息对应的设备发送对应于所述意图信息的指令。/n
【技术特征摘要】
1.一种语音交互设备,其特征在于,包括:
存储模块,用于存储一个或多个设备的设备信息;
语音交互模块,用于与用户进行语音交互;
语音处理模块,用于从所述语音交互模块接收到的语音中识别实体信息和意图信息;以及
设备管理模块,用于根据所述存储模块存储的设备信息,向与所述实体信息对应的设备发送对应于所述意图信息的指令。
2.根据权利要求1所述的语音交互设备,其特征在于,所述语音处理模块包括:
语音识别模块,用于将所述语音识别为文本;
置信度判断模块,用于判断所识别的文本的置信度是否达到预定置信度阈值;以及
自然语言理解模块,用于在判定所述置信度达到所述置信度阈值的情况下,对所识别的文本进行分析以得到所述实体信息和意图信息。
3.根据权利要求1所述的语音交互设备,其特征在于,
所述语音处理模块还从所述语音中识别与所述实体信息和/或所述意图信息相关联的属性信息,
所述设备管理模块根据所述属性信息确定与所述实体信息对应的设备,并且/或者基于所述属性信息生成对应于所述意图信息的指令。
4.根据权利要求1所述的语音交互设备,其特征在于,
设备的所述设备信息包括针对所述设备的指令的指令协议,
所述设备管理模块根据所述指令协议生成所述指令。
5.根据权利要求1所述的语音交互设备,其特征在于,还包括:
通信模块,用于与管理所述一个或多个设备的物联网服务器通信,从所述物联网服务器接收所述一个或多个设备的设备信息。
6.根据权利要求5所述的语音交互设备,其特征在于,
所述设备管理模块从所述存储模块查找与所述实体信息对应的设备的设备信息,
在查找到与所述实体信息对应的设备的设备信息的情况下,所述设备管理模块生成所述指令,并向所述实体信息对应的设备发送所述指令。
7.根据权利要求6所述的语音交互设备,其特征在于,
所述通信模块还用于与语音处理服务器通信,向语音处理服务器上传所述语音交互模块接收到的语音,以便所述语音处理服务器进行语音识别和自然语言理解,并向物联网服务器发送所述自然语言理解的结果,
在所述设备管理模块查找到与所述实体信息对应的设备的设备信息的情况下,所述通信模块向所述语音处理服务器发送终止语音识别和/或自然语言理解的消息。
8.根据权利要求7所述的语音交互设备,其特征在于,
在所述设备管理模块没有查找到与所述实体信息对应的设备的设备信息的情况下,或者所查找到的设备不适于执行对应于所述意图信息的操作的情况下,在所述语音交互模块判定所述语音结束后,所述通信模块向所述语音处理服务器发送语音结束消息,
所述语音处理服务器对语音识别得到的文本进行自然语言理解,并向物联网服务器发送所述自然语言理解的结果。
9.根据权利要求8所述的语音交互设备,其特征在于,
维护命中标记,
在所述设备管理模块查找到与所述实体信息对应的设备的设备信息以前,保持所述命中标记为表示没有命中的第一状态,
在所述设备管理模块查找到与所述实体信息对应的设备的设备信息的情况下,将所述命中标记设置为表示命中的第二状态,
所述通信模块根据所述命中标记确定是否向所述服务器发送所述终止语音识别和/或自然语言理解的消息和/或所述语音结束消息。
10.根据权利要求5所述的语音交互设备,其特征在于,
所述通信模块分批次接收所述物联网服务器下发的设备信息,每个批次的数据量不超过预定数据量阈值。
11.根据权利要求1所述的语音交互设备,其特征在于,
所述一个或多个设备是与所述语音交互设备关联的设备;并且/或者
所述语音交互设备是智能音箱或者语音处理模组。
12.一种语音交互系统,其特征在于,包括:
一个或多个设备;以及
语音交互设备,其上存储有所述一个或多...
【专利技术属性】
技术研发人员:杨昔水,胡聪钢,雷京颢,李奋,黄启生,李岳冰,刘兆健,刘畅,风翮,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。