语音、视觉、RFID结合多模态模型的玩具交互方法技术

技术编号：44296985 阅读：15 留言：0更新日期：2025-02-18 20:16

本发明专利技术实施例是一种语音、视觉、RFID结合多模态模型的玩具交互方法：该方法包括一个主玩具单元和多个辅玩具单元，主玩具单元内设有控制器，连接RFID读写器、麦克风、摄像头、RFID标签和扬声器，每个辅玩具单元配备RFID标签；主玩具单元启动时，用户可通过手机连接并设置主玩具单元模式，摄像头收集视觉信息，麦克风收集语音信息并发送信号至多模态模型，当辅玩具单元与主玩具单元靠近时，RFID标签激活并发送信号至多模态模型；模型解析信号后生成模型输出并返回给主玩具单元，主玩具单元随即完成互动响应；主玩具单元根据用户设置模式、玩具各单元的连接状态、RFID标签信息、视觉输入、语音输入，动态调整互动模式和输出内容。本发明专利技术实施例可提升交互体验。

全部详细技术资料下载

【技术实现步骤摘要】

本文件涉及人工智能领域，具体涉及语音、视觉、rfid结合多模态模型的玩具交互方法。

技术介绍

1、当前，消费者对于玩具的可玩性、互动性和教育价值的期待不断提升，促使玩具制造商推出了各式各样的创新玩具，以期满足这一日益增长的需求。

2、然而，尽管市场上玩具种类繁多，许多玩具在提供互动体验和教育潜力方面仍存在局限。这些玩具通常依赖于预设程序和基础传感器技术，如触摸或声音传感器，来响应用户的操作。这种设计虽然能够实现基本的互动，但其固定的响应模式无法适应用户行为的多样性或环境的变化，限制了玩具的适应性和教育潜力。此外，这些玩具往往缺乏与用户进行深入交流的能力，无法提供更加丰富和个性化的互动体验，从而无法充分发挥其在促进儿童认知发展和社交技能等方面的潜力。

技术实现思路

1、本专利技术实施例提供了一种语音、视觉、rfid结合多模态模型的玩具交互方法，通过本专利技术实施例提供的玩具交互方法，可以改善当前玩具缺少深度交流能力和个性化互动能力，进一步提升玩具的教育和娱乐价值。

2...

【技术保护点】

1.一种语音、视觉、RFID作为多模态模型输入的方法，所述方法包括：

2.根据权利要求1所述的方法，其特征在于：所述主玩具单元的控制器具备识别辅玩具单元的RFID标签信息的功能，以确定辅玩具单元的身份。

3.根据权利要求1所述的方法，其特征在于：所述麦克风收集的语音信息包括语音识别和文字转录，将识别后的语音信息发送至多模态模型，多模态模型生成模型输出后返回给主玩具单元。

4.根据权利要求1所述的方法，其特征在于：所述多模态模型能够解析摄像头收集的视觉信息，并结合语音信息和RFID标签信息，以生成更加精准的模型输出。

5.根据权利要求1所述的...

【技术特征摘要】

1.一种语音、视觉、rfid作为多模态模型输入的方法，所述方法包括：

2.根据权利要求1所述的方法，其特征在于：所述主玩具单元的控制器具备识别辅玩具单元的rfid标签信息的功能，以确定辅玩具单元的身份。

4.根据权利要求1所述的方法，其特征在于：所述多模态模型能够解析摄像头收集的视觉信息，并结合语音信息和rfid标签信息，以生成更加精准的模型输出。

5.根据权利要求1所述的方法，其特征在于：所述主玩具单元能够根据辅玩具单元的rfid标签信息和视觉、语音输入，动态调整互动模式和输出内容，包括但不限于语音、音乐、灯光和动作。

6.根据权利要求1所述的方法，其特征在于：所述主玩具单元的控制器具备学习功能，能够根据用户的互动历史和偏好，实时优化互动响应和输出内容。

7.根据权利要求1所述的方法，其特征在于：所述主玩具单元和云服务器之间的连接通过无线的方式，无线连接使用wi-fi通信协议。

8.根据权利...

【专利技术属性】
技术研发人员：陈彦彤，
申请(专利权)人：陈彦彤，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人