【技术实现步骤摘要】
本文件涉及人工智能领域,具体涉及语音、视觉、rfid结合多模态模型的玩具交互方法。
技术介绍
1、当前,消费者对于玩具的可玩性、互动性和教育价值的期待不断提升,促使玩具制造商推出了各式各样的创新玩具,以期满足这一日益增长的需求。
2、然而,尽管市场上玩具种类繁多,许多玩具在提供互动体验和教育潜力方面仍存在局限。这些玩具通常依赖于预设程序和基础传感器技术,如触摸或声音传感器,来响应用户的操作。这种设计虽然能够实现基本的互动,但其固定的响应模式无法适应用户行为的多样性或环境的变化,限制了玩具的适应性和教育潜力。此外,这些玩具往往缺乏与用户进行深入交流的能力,无法提供更加丰富和个性化的互动体验,从而无法充分发挥其在促进儿童认知发展和社交技能等方面的潜力。
技术实现思路
1、本专利技术实施例提供了一种语音、视觉、rfid结合多模态模型的玩具交互方法,通过本专利技术实施例提供的玩具交互方法,可以改善当前玩具缺少深度交流能力和个性化互动能力,进一步提升玩具的教育和娱乐价值。
2
...【技术保护点】
1.一种语音、视觉、RFID作为多模态模型输入的方法,所述方法包括:
2.根据权利要求1所述的方法,其特征在于:所述主玩具单元的控制器具备识别辅玩具单元的RFID标签信息的功能,以确定辅玩具单元的身份。
3.根据权利要求1所述的方法,其特征在于:所述麦克风收集的语音信息包括语音识别和文字转录,将识别后的语音信息发送至多模态模型,多模态模型生成模型输出后返回给主玩具单元。
4.根据权利要求1所述的方法,其特征在于:所述多模态模型能够解析摄像头收集的视觉信息,并结合语音信息和RFID标签信息,以生成更加精准的模型输出。
5.
...【技术特征摘要】
1.一种语音、视觉、rfid作为多模态模型输入的方法,所述方法包括:
2.根据权利要求1所述的方法,其特征在于:所述主玩具单元的控制器具备识别辅玩具单元的rfid标签信息的功能,以确定辅玩具单元的身份。
3.根据权利要求1所述的方法,其特征在于:所述麦克风收集的语音信息包括语音识别和文字转录,将识别后的语音信息发送至多模态模型,多模态模型生成模型输出后返回给主玩具单元。
4.根据权利要求1所述的方法,其特征在于:所述多模态模型能够解析摄像头收集的视觉信息,并结合语音信息和rfid标签信息,以生成更加精准的模型输出。
5.根据权利要求1所述的方法,其特征在于:所述主玩具单元能够根据辅玩具单元的rfid标签信息和视觉、语音输入,动态调整互动模式和输出内容,包括但不限于语音、音乐、灯光和动作。
6.根据权利要求1所述的方法,其特征在于:所述主玩具单元的控制器具备学习功能,能够根据用户的互动历史和偏好,实时优化互动响应和输出内容。
7.根据权利要求1所述的方法,其特征在于:所述主玩具单元和云服务器之间的连接通过无线的方式,无线连接使用wi-fi通信协议。
8.根据权利...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。