多模态交互方法和装置制造方法及图纸

技术编号：42647201 阅读：19 留言：0更新日期：2024-09-06 01:41

本申请实施例提供一种多模态交互方法，属于人工智能技术领域，该方法可以应用于基于生成式人工智能AIGC技术的人机对话应用程序中，该方法包括：接收用户在对话界面中的输入信息；输入信息，为不包含指定的关键词信息；指定的关键词用于指示输出形式包括图像或多模态；基于输入信息，生成与输入信息对应的多模态数据；在对话界面中显示多模态数据。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种多模态交互方法和装置。

技术介绍

1、目前一些语言大模型，仅支持输出文本内容，例如，用户提出问题“可以给我几张栀子花的图片吗？”，对于该问题的回答为“对不起，作为一个大语言模型，我无法直接提供图片。但是，你可以在网上搜索“栀子花图片”，那里有许多关于栀子花的图片，包括栀子花的各种形态和颜色的图片”，这种只有文本的输出，表达的信息量有限，不够直观，还需要用户再次手动搜索相关的图片，导致内容理解成本高，降低用户体验。

技术实现思路

1、本申请实施例提供一种多模态交互方法和装置，能够输出多模态数据，例如输出文字和文字相关的图像，图像能够非常直观地显示用户所需要了解的内容，相比于单纯的文字更为形象生动，有助于提升用户体验。

2、本申请实施例提供一种多模态交互方法，应用于基于生成式人工智能aigc技术的人机对话应用程序中，该方法包括：接收用户在对话界面中的输入信息；输入信息，为不包含指定的关键词信息；指定的关键词用于指示输出形式包括图像或多模态；基于输入信...

【技术保护点】

1.一种多模态交互方法，应用于基于生成式人工智能AIGC技术的人机对话应用程序中，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，

3.如权利要求2所述的方法，其特征在于，

4.如权利要求3所述的方法，其特征在于，

5.根据权利要求3所述的方法，其特征在于，

6.如权利要求4或5所述的方法，其特征在于，

7.如权利要求2所述的方法，其特征在于，

8.如权利要求1所述的方法，其特征在于，

9.如权利要求8所述的方法，其特征在于，

10.如权利要求9所述的方法，其特...

【技术特征摘要】

1.一种多模态交互方法，应用于基于生成式人工智能aigc技术的人机对话应用程序中，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，

3.如权利要求2所述的方法，其特征在于，

4.如权利要求3所述的方法，其特征在于，

5.根据权利要求3所述的方法，其特征在于，

6.如权利要求4或5所述的方法，其特征在于，

7.如权利要求2所述的方法，其特征在...

【专利技术属性】
技术研发人员：牛琳琳，
申请(专利权)人：北京百川智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人