智能设备的交互方法、装置、设备及存储介质制造方法及图纸

技术编号：26422399 阅读：34 留言：0更新日期：2020-11-20 14:18

本申请提出了一种智能设备的交互方法、装置、设备及存储介质，涉及语音识别、语音交互、自然语言处理和人机交互技术领域，具体实现方案为：接收用户的语音指令；根据语音指令进行意图预测以生成预测意图；当预测意图包括多模态交互意图时，生成多模态交互预指令并发送至多模态识别组件，以使多模态采集组件根据多模态交互预指令预采集多模态数据。根据本申请能够提高多模态交互效率，缩短用户进行多模态交互时的等待时延，提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
智能设备的交互方法、装置、设备及存储介质
本申请涉及数据处理
，尤其涉及语音识别、语音交互、自然语言处理和人机交互
，提出一种智能设备的交互方法、装置、设备及存储介质。
技术介绍
随着人机交互技术的进步，在智能设备上通过文字、语音、视觉、动作等多种方式进行多模态交互的人机交互场景越发常见，通过语音、视觉和动作的结合能够带来更多维度的用户体验和更多的产品交互形式。目前，在多模态交互过程中，由于硬件设备启动、执行等耗时较长，导致多模态交互中用户等待时间较长，交互效率有待提高。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请提出了一种智能设备的交互方法、装置、设备及存储介质。本申请第一方面实施例提出了一种智能设备的交互方法，其中，所述方法包括：接收用户的语音指令；根据所述语音指令进行意图预测以生成预测意图；当所述预测意图包括多模态交互意图时，生成多模态交互预指令并发送至多模态识别组件，以使多模态采集组件根据所述多模态交互预指令预采集多模态数据。本申请第二方面实施例提出了一种智能设备的交互装置，其中，所述装置包括：接收模块，用于接收用户的语音指令；预测模块，用于根据所述语音指令进行意图预测以生成预测意图；启动模块，用于当所述预测意图包括多模态交互意图时，生成多模态交互预指令并发送至多模态识别组件，以使多模态采集组件根据所述多模态交互预指令预采集多模态数据。本申请第三方面实...

【技术保护点】
1.一种智能设备的交互方法，其中，所述方法包括：/n接收用户的语音指令；/n根据所述语音指令进行意图预测以生成预测意图；/n当所述预测意图包括多模态交互意图时，生成多模态交互预指令并发送至多模态识别组件，以使多模态采集组件根据所述多模态交互预指令预采集多模态数据。/n

【技术特征摘要】
1.一种智能设备的交互方法，其中，所述方法包括：
接收用户的语音指令；
根据所述语音指令进行意图预测以生成预测意图；
当所述预测意图包括多模态交互意图时，生成多模态交互预指令并发送至多模态识别组件，以使多模态采集组件根据所述多模态交互预指令预采集多模态数据。

2.如权利要求1所述的智能设备的交互方法，还包括：
对所述语音指令进行识别，以提取所述语音识别指令之中的用户意图；
如果所述预测意图和所述用户意图一致，则调用所述多模态识别组件对所述多模态数据进行处理以生成多模态识别结果。

3.如权利要求2所述的智能设备的交互方法，还包括：
如果所述预测意图和所述用户意图不一致，则将预采集的所述多模态数据删除。

4.如权利要求2所述的智能设备的交互方法，其中，所述根据所述语音指令进行意图预测以生成预测意图，包括：
对所述语音指令进行切词以生成多个分词；
依次对所述多个分词进行识别以生成所述分词的词性特征和词义特征；
当所述分词的词性特征和词义特征符合预设的指定代词或目的动词时，判断生成多模态交互意图。

5.如权利要求4所述的智能设备的交互方法，其中，所述对所述语音指令进行识别，以提取所述语音识别指令之中的用户意图，包括：
将所述多个分词输入至意图识别模型之中以生成所述用户意图。

6.权利要求2所述的智能设备的交互方法，在所述调用所述多模态识别组件对所述多模态数据进行处理以生成多模态识别结果之后，还包括：
延迟预设时间关闭所述多模态识别组件和多模态采集组件。

7.一种智能设备的交互装置，其中，所述装置包括：
接收模块，用于接收用户的语音指令；
预测模块，用于根据所述语音指令进行意图预测以生成预测意图；
启动模块，用于当所述预测意图包...

【专利技术属性】
技术研发人员：龙云翔，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人