多模态意图识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：36407050 阅读：19 留言：0更新日期：2023-01-18 10:15

本申请提供一种多模态意图识别方法、装置、电子设备和存储介质。涉及人工智能技术领域，所述方法包括：获取待识别数据,所述待识别数据包括至少两种模态的数据，每一模态数据具有不同的数据类型；对所述待识别数据进行编码，得到每一模态数据的表示序列；将所述每一模态数据的表示序列作为节点特征，构建多模态异构图；通过基于注意力机制的全局视图对所述多模态异构图进行编码，得到所述多模态异构图的表示；根据所述多模态异构图的表示进行分类，得到意图识别结果。上述方法可有效地对多模态信息进行融合，采用多模态异构图提升用户交互意图识别准确率，实现自然灵活的人机交互。互。互。

全部详细技术资料下载

【技术实现步骤摘要】
多模态意图识别方法、装置、电子设备和存储介质

[0001]本申请涉及人工智能
，尤其涉及一种多模态意图识别方法、装置、电子设备和存储介质。

技术介绍

[0002]意图识别用于分析用户的核心需求,输出与查询输入最相关的信息,现有技术中通常的任务型对话意图识别任务通常只解决单一的意图识别，通常是获取样本文本中的词向量以及上下文词向量进行训练，得到意图识别模型，意图识别模型通过确定用户输入对应的意图，进而生成并执行一系列行为和策略，实现与用户的交互。但现实生活中我们往往需要利用多种模态信息（如自然语言、视频和音频信号等）去综合判断真实意图，除了最为普遍的文字以外，图片、视频、音频等多模态的数据也能够应用于辅助理解用户意图，以此提高信息服务的准确度。
[0003]例如在电力系统领域，电力故障报修中常常会面临文字难以描述的场景，因为在客服的会话中，用户不仅会发来纯文本信息，还可能包含图像和语音信息等。例如，充电桩报修/安装，常常无法通过文本直接进行描述，通常通过拍照的方式进行报修或询问，可能需要综合考虑到文本和图像信息才能准确地判断出用户意图。
[0004]然而，目前多数意图基准数据集仍只包含文本模态信息，人机交互数据单一，少数对多模态意图识别的方式也是通过融合多模态预训练模型和注意力机制进行训练，得到多模态意图识别模型，识别准确率不高，模态融合方式简单，极大限制了多模态意图理解领域的发展，针对电力故障报修领域的多意图识别更是鲜有研究。
[0005]因此，提高多模态意图识别的识别准确率是亟需解决的...

【技术保护点】

【技术特征摘要】
1.一种多模态意图识别方法，其特征在于，所述方法包括：获取待识别数据,所述待识别数据包括至少两种模态的数据，每一模态数据具有不同的数据类型；对所述待识别数据进行编码，得到每一模态数据的表示序列；将所述每一模态数据的表示序列作为节点特征，构建多模态异构图；通过基于注意力机制的全局视图对所述多模态异构图进行编码，得到所述多模态异构图的表示；根据所述多模态异构图的表示进行分类，得到意图识别结果。2.根据权利要求1所述的多模态意图识别方法，其特征在于，所述待识别数据包括文本数据、图片数据和音频数据，所述对所述待识别数据进行编码，得到每一模态数据的表示序列，包括：对所述文本数据进行分词处理，得到多个词，对所述词进行编码，得到第一编码信息；对所述图片数据进行图像特征提取，得到多个图像区域，对所述图像区域进行编码，得到第二编码信息；对所述音频数据进行音频特征提取，得到多个音频片段，对所述音频片段进行编码，得到第三编码信息；将所述第一编码信息、第二编码信息和第三编码信息作为三模态预训练模型的输入，得到分别对应于所述文本数据、图片数据和音频数据的文本序列、图片序列和音频序列。3.根据权利要求2所述的多模态意图识别方法，其特征在于，所述方法还包括：对于所述文本数据，通过最小化负对数似然函数对所述三模态预训练模型进行训练，得到所述文本序列；对于所述图片数据，通过设置第一函数和第二函数对所述三模态预训练模型进行训练，得到所述图片序列；对于所述音频数据，通过设置第三函数和第四函数对所述三模态预训练模型进行训练，得到所述音频序列。4.根据权利要求2所述的多模态意图识别方法，其特征在于，将所述每一模态数据的表示序列作为节点特征，构建多模态异构图，包括：根据不同模态数据得到不同的节点类型，根据每一模态数据的表示序列中的元素的数量，确定每一节点类型的节点数；其中，根据所述文本数据中的词的数量得到文本节点的节点数，根据所述图片数据的图像区域的数量得到图片节点的节点数，根据所述音频数据的音频片段的数量得到音频节点的节点数。5.根据权利要求1所述的多模态意图识别方法，其特征在于，通过基于...

【专利技术属性】
技术研发人员：张烁，刘芳，陈曦，杨睿，安业腾，张惠民，张妍，赵伟，王晨飞，徐李阳，
申请(专利权)人：国家电网有限公司客户服务中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人