【技术实现步骤摘要】
本专利技术涉及人工智能,特别涉及一种多模态智能问答机器人以及其搭建方法。
技术介绍
1、在人工智能和机器人技术快速发展的背景下,智能问答机器人已经成为人们日常生活和工作的重要助手。然而,现有的智能问答机器人大多数只能通过文本或语音进行交互,无法同时处理多种模态的信息,例如图像、视频等。这限制了智能问答机器人在一些场景下的应用,需要同时处理图像和文本信息的场景。
技术实现思路
1、本专利技术要解决的技术问题是提供一种多模态智能问答机器人以及其搭建方法,能够接收、处理并响应来自用户的多种模态输入(如文本、语音、图像和视频),从而提高问答的准确性和效率。
2、为了解决上述技术问题,本专利技术的技术方案为:
3、一种多模态智能问答机器人,包括:
4、用户接口层:用于接收用户的信息输入,并将机器人的回答输出给用户;
5、多模态预处理层:该层对用户的输入进行预处理,包括文本分词、语音转文本以及图像识别;
6、多模态信息融合层:负责将来自不同模
...【技术保护点】
1.一种多模态智能问答机器人,其特征在于,包括:
2.一种如权利要求1所述的多模态智能问答机器人的搭建方法,其特征在于,包括以下步骤:
3.根据权利要求2所述的多模态智能问答机器人的搭建方法,其特征在于:收集多种模态的信息的方式包括,通过传感器、摄像头、麦克风设备收集用户输入的文本、语音、图像和视频信息,从互联网、数据库等来源导入获取相关知识,以丰富问答机器人的知识库。
4.根据权利要求2所述的多模态智能问答机器人的搭建方法,其特征在于:信息预处理包括对文本进行分词、词性标注、停用词去除;对语音进行降噪、特征提取;对图像进行目标检测
...【技术特征摘要】
1.一种多模态智能问答机器人,其特征在于,包括:
2.一种如权利要求1所述的多模态智能问答机器人的搭建方法,其特征在于,包括以下步骤:
3.根据权利要求2所述的多模态智能问答机器人的搭建方法,其特征在于:收集多种模态的信息的方式包括,通过传感器、摄像头、麦克风设备收集用户输入的文本、语音、图像和视频信息,从互联网、数据库等来源导入获取相关知识,以丰富问答机器人的知识库。
4.根据权利要求2所述的多模态智能问答机器人的搭建方法,其特征在于:信息预处理包括对文本进行分词、词性标注、停用词去除;对语音进行降噪、特征提取;对图像进行目标检测、特征提取操作;对视频进行关键帧提取、特征提取。
...
【专利技术属性】
技术研发人员:杨兴荣,魏永强,杨兴海,李建州,
申请(专利权)人:世纪恒通科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。