信息交互方法、装置、设备以及存储介质制造方法及图纸

技术编号：30545380 阅读：26 留言：0更新日期：2021-10-30 13:23

本公开提供了信息交互方法、装置、设备以及存储介质，涉及人工智能技术领域。具体实现方案为：响应于满足预设的图像采集条件，采集目标对象的多张图像；对多张图像进行分析，确定与目标对象对应的指令；根据指令，输出交互信息。本实现方式可以提高人机交互体验。本实现方式可以提高人机交互体验。本实现方式可以提高人机交互体验。

全部详细技术资料下载

【技术实现步骤摘要】
信息交互方法、装置、设备以及存储介质

[0001]本公开涉及计算机
，具体涉及人工智能
、语音识别领域和图像识别领域，尤其涉及信息交互方法、装置、设备以及存储介质。

技术介绍

[0002]中国老龄化社会已经到来，老年人的健康和生活服务需求迫切且巨大。随着人工智能技术的发展，越来越多的公司和机构从事居家机器人研发，各种形式和各种功能的机器人相继出现。这些机器人逐渐承担一些重复、繁重的工作，成为居家老人日常生活的护理助手。
[0003]现有的家用机器人功能不丰富，有的系统只能识别特定的语音控制指令，对于意思相近的指令则无法识别。有的系统只能通过将人们提出的问题和本地问题模板进行匹配从而给出应答，其功能比较单一，拓展性较差。

技术实现思路

[0004]本公开提供了一种信息交互方法、装置、设备以及存储介质。
[0005]根据第一方面，提供了一种信息交互方法，包括：响应于满足预设的图像采集条件，采集目标对象的多张图像；对多张图像进行分析，确定与目标对象对应的指令；根据指令，输出交互信息。r/>[0006]根本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息交互方法，包括：响应于满足预设的图像采集条件，采集目标对象的多张图像；对所述多张图像进行分析，确定与所述目标对象对应的指令；根据所述指令，输出交互信息。2.根据权利要求1所述的方法，其中，所述方法还包括：监测以下至少一项是否满足：自上次采集所述目标对象的图像经过了预设时长、接收到图像采集指令；响应于以上至少一项满足，确定满足所述预设的图像采集条件。3.根据权利要求1所述的方法，其中，所述对所述多张图像进行分析，确定与所述目标对象对应的指令，包括：对所述多张图像进行分类，并基于分类结果确定所述目标对象的状态；响应于确定所述目标对象的状态满足预设的报警条件，确定报警指令；所述根据所述指令，输出交互信息，包括：根据所述报警指令，将所述多张图像中的至少一张发送给目标终端。4.根据权利要求1所述的方法，其中，所述响应于满足预设的图像采集条件，采集目标对象的多张图像，包括：响应于接收到语音指令，对所述语音指令进行意图检测以及槽位填充，确定用户意图以及槽位标签；根据所述用户意图以及所述槽位标签，确定目标对象以及采集所述目标对象的多张图像。5.根据权利要求4所述的方法，其中，所述对所述语音指令进行意图检测以及槽位填充，确定用户意图以及槽位标签，包括：对所述语音指令进行语音识别，得到语音文本；对所述语音文本进行意图检测以及槽位填充，确定用户意图以及槽位标签。6.根据权利要求5所述的方法，其中，所述对所述语音指令进行语音识别，得到语音文本，包括：对所述语音指令进行语音激活检测，确定所述语音指令的起始点和结束点；对所述起始点和所述结束点之间的语音进行数字化，提取数字化后的音频的特征；根据所提取的数字化后的音频的特征以及预先训练的向量确定模型，确定所述音频对应的向量；对所述音频对应的向量进行解码，确定所述语音文本。7.根据权利要求5所述的方法，其中，所述对所述语音文本进行意图检测以及槽位填充，确定用户意图以及槽位标签，包括：对所述语音文本进行编码，确定所述语音文本对应的文本向量；对所述文本向量进行编码，确定所述文本向量对应的意图分类向量以及多个槽位预测向量；根据所述意图分类向量以及所述多个槽位预测向量，确定用户意图以及槽位标签。8.根据权利要求7所述的方法，其中，所述根据所述意图分类向量以及所述多个槽位预测向量，确定用户意图以及槽位标签，包括：
对所述意图分类向量进行分类，并基于分类结果确定用户意图；分别将所述意图分类向量与各槽位预测向量进行拼接，得到多个拼接向量；对各拼接向量进行分类，并基于分类结果确定槽位标签。9.根据权利要求1所述的方法，其中，所述对所述多张图像进行分析，确定与所述目标对象对应的指令，包括：对所述多张图像进行目标检测，确定所述目标对象的位置；根据所述目标对象的位置，确定与所述目标对象之间的距离；根据所述目标对象的位置以及与所述目标对象之间的距离，确定操作指令；所述根据所述指令，输出交互信息，包括：执行所述操作指令，并输出操作结果。10.根据权利要求9所述的方法，其中，所述执行所述操作指令，包括：根据所处环境的信息和/或所述目标对象的类型，确定移动速度；以所述移动速度移动。11.根据权利要求9所述的方法，其中，所述输出操作结果，包括：获取所述操作指令的执行进度，根据所述执行进度生成响应文本；输出所述响应文本对应的语音。12.根据权利要求11所述的方法，其中，所述输出所述响应文本对应的语音，包括：确定所述响应文本对应的音频波形；基于所述音频波形，输出所述响应文本对应的语音。13.一种信息交互装置，包括：图像采集单元，被配置成响应于满足预设的图像采集条件，采集目标对象的多张图像；指令确定单元，被配置成对所述多张图像进行分析，确定与所述目标对象对应的指令；信息交互单元，被配置成根据所述指令，输出交互信...

【专利技术属性】
技术研发人员：冯博豪，陈禹燊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人