当前位置: 首页 > 专利查询>陈彦彤专利>正文

语音、视觉、RFID结合多模态模型的玩具交互方法技术

技术编号:44296985 阅读:15 留言:0更新日期:2025-02-18 20:16
本发明专利技术实施例是一种语音、视觉、RFID结合多模态模型的玩具交互方法:该方法包括一个主玩具单元和多个辅玩具单元,主玩具单元内设有控制器,连接RFID读写器、麦克风、摄像头、RFID标签和扬声器,每个辅玩具单元配备RFID标签;主玩具单元启动时,用户可通过手机连接并设置主玩具单元模式,摄像头收集视觉信息,麦克风收集语音信息并发送信号至多模态模型,当辅玩具单元与主玩具单元靠近时,RFID标签激活并发送信号至多模态模型;模型解析信号后生成模型输出并返回给主玩具单元,主玩具单元随即完成互动响应;主玩具单元根据用户设置模式、玩具各单元的连接状态、RFID标签信息、视觉输入、语音输入,动态调整互动模式和输出内容。本发明专利技术实施例可提升交互体验。

【技术实现步骤摘要】

本文件涉及人工智能领域,具体涉及语音、视觉、rfid结合多模态模型的玩具交互方法。


技术介绍

1、当前,消费者对于玩具的可玩性、互动性和教育价值的期待不断提升,促使玩具制造商推出了各式各样的创新玩具,以期满足这一日益增长的需求。

2、然而,尽管市场上玩具种类繁多,许多玩具在提供互动体验和教育潜力方面仍存在局限。这些玩具通常依赖于预设程序和基础传感器技术,如触摸或声音传感器,来响应用户的操作。这种设计虽然能够实现基本的互动,但其固定的响应模式无法适应用户行为的多样性或环境的变化,限制了玩具的适应性和教育潜力。此外,这些玩具往往缺乏与用户进行深入交流的能力,无法提供更加丰富和个性化的互动体验,从而无法充分发挥其在促进儿童认知发展和社交技能等方面的潜力。


技术实现思路

1、本专利技术实施例提供了一种语音、视觉、rfid结合多模态模型的玩具交互方法,通过本专利技术实施例提供的玩具交互方法,可以改善当前玩具缺少深度交流能力和个性化互动能力,进一步提升玩具的教育和娱乐价值。

2、第一方面,本专利技本文档来自技高网...

【技术保护点】

1.一种语音、视觉、RFID作为多模态模型输入的方法,所述方法包括:

2.根据权利要求1所述的方法,其特征在于:所述主玩具单元的控制器具备识别辅玩具单元的RFID标签信息的功能,以确定辅玩具单元的身份。

3.根据权利要求1所述的方法,其特征在于:所述麦克风收集的语音信息包括语音识别和文字转录,将识别后的语音信息发送至多模态模型,多模态模型生成模型输出后返回给主玩具单元。

4.根据权利要求1所述的方法,其特征在于:所述多模态模型能够解析摄像头收集的视觉信息,并结合语音信息和RFID标签信息,以生成更加精准的模型输出。

5.根据权利要求1所述的...

【技术特征摘要】

1.一种语音、视觉、rfid作为多模态模型输入的方法,所述方法包括:

2.根据权利要求1所述的方法,其特征在于:所述主玩具单元的控制器具备识别辅玩具单元的rfid标签信息的功能,以确定辅玩具单元的身份。

3.根据权利要求1所述的方法,其特征在于:所述麦克风收集的语音信息包括语音识别和文字转录,将识别后的语音信息发送至多模态模型,多模态模型生成模型输出后返回给主玩具单元。

4.根据权利要求1所述的方法,其特征在于:所述多模态模型能够解析摄像头收集的视觉信息,并结合语音信息和rfid标签信息,以生成更加精准的模型输出。

5.根据权利要求1所述的方法,其特征在于:所述主玩具单元能够根据辅玩具单元的rfid标签信息和视觉、语音输入,动态调整互动模式和输出内容,包括但不限于语音、音乐、灯光和动作。

6.根据权利要求1所述的方法,其特征在于:所述主玩具单元的控制器具备学习功能,能够根据用户的互动历史和偏好,实时优化互动响应和输出内容。

7.根据权利要求1所述的方法,其特征在于:所述主玩具单元和云服务器之间的连接通过无线的方式,无线连接使用wi-fi通信协议。

8.根据权利...

【专利技术属性】
技术研发人员:陈彦彤
申请(专利权)人:陈彦彤
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1