语音交互设备和系统、设备控制方法、计算设备以及介质技术方案

技术编号:25712035 阅读:12 留言:0更新日期:2020-09-23 02:58
公开了一种语音交互设备、语音交互系统以及设备控制方法。该语音交互设备从物联网服务器接收并在本地的存储模块存储一个或多个设备的设备信息。语音交互模块与用户进行语音交互。语音交互设备本地的语音处理模块从语音交互模块接收到的语音中识别实体信息和意图信息。语音交互设备本地的设备管理模块向与实体信息对应的设备发送对应于意图信息的指令。通过在本地的语音交互设备上部署语音识别、自然语言理解和物联网设备控制指令封装模块,实现了物联网设备管理本地化,减少了云端链路上的网络开销,不需等待云端语音识别的结果,因此缩短了从用户说话到实现控制之间的响应时间,从而提升响应速度,改善用户体验。

【技术实现步骤摘要】
语音交互设备和系统、设备控制方法、计算设备以及介质
本公开涉及一种语音交互领域,特别涉及通过语音控制设备的语音交互设备、语音交互系统以及设备控制方法。
技术介绍
随着物联网的普及与发展,业已实现用语音对各类物联网设备进行控制。一般地,终端的语音交互设备将所接收到的语音上传到云端,借助云端强大的处理能力进行语音识别和自然语言理解。物联网服务器根据自然语言理解的结果生成控制指令下发到相应的物联网设备。用户说话的同时,语音交互设备可以将音频文件上传到云端,通过云端自动语音识别(ASR)引擎识别并输出文本。然而,在用户说完话后,语音交互设备需要经过算法判断用户是否说完话。一般地,语音交互设备会等待1秒左右,然后闭麦,即关闭麦克风。然后,将云端ASR文本输出到云端自然语言理解(NLU)引擎,输出自然语言处理(NLP)信息。在用户的语音涉及物联网设备控制时,云端将NLP信息发送到物联网IOT服务端。IOT服务端进行指令封装,并向对应的物联网设备下发控制指令。然而,云端ASR引擎对音频文件的解析存在耗时情况,端上等待云端ASR的文本输出也需要等待时间,同时还需要有网络开销。另外,IOT设备控制也需要经过IOT服务,这个过程中链路上应用比较多,中间各应用也会耗时。这样,当通过语音交互设备控制IOT设备时,响应往往比较慢。因此,需要一种新的语音交互方案,以提升响应速度,改善用户体验。
技术实现思路
本专利技术所要解决的技术问题是提供一种语音交互设备控制方案,其能够提升相应速度,改善用户体验。根据本公开第一个方面,提供了一种语音交互设备,包括:存储模块,用于存储一个或多个设备的设备信息;语音交互模块,用于与用户进行语音交互;语音处理模块,用于从语音交互模块接收到的语音中识别实体信息和意图信息;以及设备管理模块,用于根据所述存储模块存储的设备信息,向与实体信息对应的设备发送对应于意图信息的指令。可选地,语音处理模块包括:语音识别模块,用于将语音识别为文本;置信度判断模块,用于判断所识别的文本的置信度是否达到预定置信度阈值;以及自然语言理解模块,用于在判定置信度达到置信度阈值的情况下,对所识别的文本进行分析以得到实体信息和意图信息。可选地,语音处理模块还从语音中识别与实体信息和/或意图信息相关联的属性信息,设备管理模块根据属性信息确定与实体信息对应的设备,并且/或者基于属性信息生成对应于意图信息的指令。可选地,设备的设备信息包括针对设备的指令的指令协议,设备管理模块根据指令协议生成指令。可选地,语音交互设备还包括:通信模块,用于与管理一个或多个设备的物联网服务器通信,从物联网服务器接收一个或多个设备的设备信息。可选地,设备管理模块从存储模块查找与实体信息对应的设备的设备信息,在查找到与实体信息对应的设备的设备信息的情况下,设备管理模块生成指令,并向实体信息对应的设备发送指令。可选地,通信模块还用于与语音处理服务器通信,向语音处理服务器上传语音交互模块接收到的语音,以便语音处理服务器进行语音识别和自然语言理解,并向物联网服务器发送自然语言理解的结果,在设备管理模块查找到与实体信息对应的设备的设备信息的情况下,通信模块向语音处理服务器发送终止语音识别和/或自然语言理解的消息。可选地,在设备管理模块没有查找到与实体信息对应的设备的设备信息的情况下,或者所查找到的设备不适于执行对应于意图信息的操作的情况下,在语音交互模块判定语音结束后,通信模块向语音处理服务器发送语音结束消息,语音处理服务器对语音识别得到的文本进行自然语言理解,并向物联网服务器发送自然语言理解的结果。可选地,维护命中标记,在设备管理模块查找到与实体信息对应的设备的设备信息以前,保持命中标记为表示没有命中的第一状态,在设备管理模块查找到与实体信息对应的设备的设备信息的情况下,将命中标记设置为表示命中的第二状态,通信模块根据命中标记确定是否向服务器发送终止语音识别和/或自然语言理解的消息和/或语音结束消息。可选地,通信模块分批次接收物联网服务器下发的设备信息,每个批次的数据量不超过预定数据量阈值。可选地,一个或多个设备是与语音交互设备关联的设备;并且/或者语音交互设备是智能音箱或者语音处理模组。根据本公开第二个方面,提供了一种语音交互系统,包括:一个或多个设备;以及语音交互设备,其上存储有一个或多个设备的设备信息,用于与用户进行语音交互,从用户的语音中识别实体信息和意图信息,并根据所存储的设备信息,向与实体信息对应的设备发送对应于意图信息的指令。可选地,还包括:物联网服务器,管理一个或多个设备,并向语音交互设备下发一个或多个设备的设备信息。可选地,物联网服务器分批次向语音交互设备下发设备信息,每个批次的数据量不超过预定数据量阈值。可选地,还包括:语音处理服务器,从语音交互设备接收用户的语音,对所接收的语音进行语音识别和自然语言理解,并向物联网服务器发送自然语言理解的结果,其中,在语音交互设备查找到与实体信息对应的设备的设备信息的情况下,通信模块向语音处理服务器发送终止语音识别和/或自然语言理解的消息,在语音交互设备没有查找到与实体信息对应的设备的设备信息的情况下,或者所查找到的设备不适于执行对应于意图信息的操作的情况下,在判定语音结束后,语音交互设备向语音处理服务器发送语音结束消息,语音处理服务器响应于语音结束消息,向物联网服务器发送自然语言理解的结果。根据本公开第三个方面,提供了一种设备控制方法,包括:本地存储一个或多个设备的设备信息;将所接收到的语音识别为文本;对所识别的文本进行分析以得到其中涉及的实体信息和意图信息;以及根据本地存储的设备信息,向与实体信息对应的设备发送对应于意图信息的指令。可选地,该设备控制方法由智能音箱设备执行,或者由语音处理模组执行。可选的,上述设备包括物联网设备。可选地,实体信息对应的设备包括:智能家居设备;和/或与家居设备关联的处理模组。可选地,还包括:判断所识别的文本的置信度是否达到预定置信度阈值,其中,在判定置信度达到置信度阈值的情况下,对所识别的文本进行分析。可选地,还包括:从管理一个或多个设备的物联网服务器接收一个或多个设备的设备信息。可选地,还包括:维护命中标记,在设备管理模块查找到与实体信息对应的设备的设备信息以前,保持命中标记为表示没有命中的第一状态,在设备管理模块查找到与实体信息对应的设备的设备信息的情况下,将命中标记设置为表示命中的第二状态,在命中标记处于第二状态的情况下,通信模块向语音处理服务器发送终止语音识别和/或自然语言理解的消息,在命中标记处于第一状态的情况下,在判定用户的语音结束后,通信模块向语音处理服务器发送语音结束消息。根据本公开的第四个方面,还提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行上述第三方面所述的方法。本文档来自技高网...

【技术保护点】
1.一种语音交互设备,其特征在于,包括:/n存储模块,用于存储一个或多个设备的设备信息;/n语音交互模块,用于与用户进行语音交互;/n语音处理模块,用于从所述语音交互模块接收到的语音中识别实体信息和意图信息;以及/n设备管理模块,用于根据所述存储模块存储的设备信息,向与所述实体信息对应的设备发送对应于所述意图信息的指令。/n

【技术特征摘要】
1.一种语音交互设备,其特征在于,包括:
存储模块,用于存储一个或多个设备的设备信息;
语音交互模块,用于与用户进行语音交互;
语音处理模块,用于从所述语音交互模块接收到的语音中识别实体信息和意图信息;以及
设备管理模块,用于根据所述存储模块存储的设备信息,向与所述实体信息对应的设备发送对应于所述意图信息的指令。


2.根据权利要求1所述的语音交互设备,其特征在于,所述语音处理模块包括:
语音识别模块,用于将所述语音识别为文本;
置信度判断模块,用于判断所识别的文本的置信度是否达到预定置信度阈值;以及
自然语言理解模块,用于在判定所述置信度达到所述置信度阈值的情况下,对所识别的文本进行分析以得到所述实体信息和意图信息。


3.根据权利要求1所述的语音交互设备,其特征在于,
所述语音处理模块还从所述语音中识别与所述实体信息和/或所述意图信息相关联的属性信息,
所述设备管理模块根据所述属性信息确定与所述实体信息对应的设备,并且/或者基于所述属性信息生成对应于所述意图信息的指令。


4.根据权利要求1所述的语音交互设备,其特征在于,
设备的所述设备信息包括针对所述设备的指令的指令协议,
所述设备管理模块根据所述指令协议生成所述指令。


5.根据权利要求1所述的语音交互设备,其特征在于,还包括:
通信模块,用于与管理所述一个或多个设备的物联网服务器通信,从所述物联网服务器接收所述一个或多个设备的设备信息。


6.根据权利要求5所述的语音交互设备,其特征在于,
所述设备管理模块从所述存储模块查找与所述实体信息对应的设备的设备信息,
在查找到与所述实体信息对应的设备的设备信息的情况下,所述设备管理模块生成所述指令,并向所述实体信息对应的设备发送所述指令。


7.根据权利要求6所述的语音交互设备,其特征在于,
所述通信模块还用于与语音处理服务器通信,向语音处理服务器上传所述语音交互模块接收到的语音,以便所述语音处理服务器进行语音识别和自然语言理解,并向物联网服务器发送所述自然语言理解的结果,
在所述设备管理模块查找到与所述实体信息对应的设备的设备信息的情况下,所述通信模块向所述语音处理服务器发送终止语音识别和/或自然语言理解的消息。


8.根据权利要求7所述的语音交互设备,其特征在于,
在所述设备管理模块没有查找到与所述实体信息对应的设备的设备信息的情况下,或者所查找到的设备不适于执行对应于所述意图信息的操作的情况下,在所述语音交互模块判定所述语音结束后,所述通信模块向所述语音处理服务器发送语音结束消息,
所述语音处理服务器对语音识别得到的文本进行自然语言理解,并向物联网服务器发送所述自然语言理解的结果。


9.根据权利要求8所述的语音交互设备,其特征在于,
维护命中标记,
在所述设备管理模块查找到与所述实体信息对应的设备的设备信息以前,保持所述命中标记为表示没有命中的第一状态,
在所述设备管理模块查找到与所述实体信息对应的设备的设备信息的情况下,将所述命中标记设置为表示命中的第二状态,
所述通信模块根据所述命中标记确定是否向所述服务器发送所述终止语音识别和/或自然语言理解的消息和/或所述语音结束消息。


10.根据权利要求5所述的语音交互设备,其特征在于,
所述通信模块分批次接收所述物联网服务器下发的设备信息,每个批次的数据量不超过预定数据量阈值。


11.根据权利要求1所述的语音交互设备,其特征在于,
所述一个或多个设备是与所述语音交互设备关联的设备;并且/或者
所述语音交互设备是智能音箱或者语音处理模组。


12.一种语音交互系统,其特征在于,包括:
一个或多个设备;以及
语音交互设备,其上存储有所述一个或多...

【专利技术属性】
技术研发人员:杨昔水胡聪钢雷京颢李奋黄启生李岳冰刘兆健刘畅风翮
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1