多模态交互方法和装置制造方法及图纸

技术编号:42647201 阅读:19 留言:0更新日期:2024-09-06 01:41
本申请实施例提供一种多模态交互方法,属于人工智能技术领域,该方法可以应用于基于生成式人工智能AIGC技术的人机对话应用程序中,该方法包括:接收用户在对话界面中的输入信息;输入信息,为不包含指定的关键词信息;指定的关键词用于指示输出形式包括图像或多模态;基于输入信息,生成与输入信息对应的多模态数据;在对话界面中显示多模态数据。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种多模态交互方法和装置


技术介绍

1、目前一些语言大模型,仅支持输出文本内容,例如,用户提出问题“可以给我几张栀子花的图片吗?”,对于该问题的回答为“对不起,作为一个大语言模型,我无法直接提供图片。但是,你可以在网上搜索“栀子花图片”,那里有许多关于栀子花的图片,包括栀子花的各种形态和颜色的图片”,这种只有文本的输出,表达的信息量有限,不够直观,还需要用户再次手动搜索相关的图片,导致内容理解成本高,降低用户体验。


技术实现思路

1、本申请实施例提供一种多模态交互方法和装置,能够输出多模态数据,例如输出文字和文字相关的图像,图像能够非常直观地显示用户所需要了解的内容,相比于单纯的文字更为形象生动,有助于提升用户体验。

2、本申请实施例提供一种多模态交互方法,应用于基于生成式人工智能aigc技术的人机对话应用程序中,该方法包括:接收用户在对话界面中的输入信息;输入信息,为不包含指定的关键词信息;指定的关键词用于指示输出形式包括图像或多模态;基于输入信息,生成与输入信息对本文档来自技高网...

【技术保护点】

1.一种多模态交互方法,应用于基于生成式人工智能AIGC技术的人机对话应用程序中,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,

3.如权利要求2所述的方法,其特征在于,

4.如权利要求3所述的方法,其特征在于,

5.根据权利要求3所述的方法,其特征在于,

6.如权利要求4或5所述的方法,其特征在于,

7.如权利要求2所述的方法,其特征在于,

8.如权利要求1所述的方法,其特征在于,

9.如权利要求8所述的方法,其特征在于,

10.如权利要求9所述的方法,其特...

【技术特征摘要】

1.一种多模态交互方法,应用于基于生成式人工智能aigc技术的人机对话应用程序中,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,

3.如权利要求2所述的方法,其特征在于,

4.如权利要求3所述的方法,其特征在于,

5.根据权利要求3所述的方法,其特征在于,

6.如权利要求4或5所述的方法,其特征在于,

7.如权利要求2所述的方法,其特征在...

【专利技术属性】
技术研发人员:牛琳琳
申请(专利权)人:北京百川智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1