一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法技术

技术编号:42298312 阅读:22 留言:0更新日期:2024-08-14 15:47
本发明专利技术提出了一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法。该方法将传统的讽刺检测任务重新定义为生成任务,利用生成式多模态大语言模型的强大跨模态交互能力。通过设计指令模板和检索模块,模型能够更好地理解任务目标,并从训练集中检索与输入样本相似的示例作为提示信息,从而提高检测性能。此外,提出了新的测试数据集RedEval,用于评估模型在不同场景下的泛化能力。该方法提高了多模态讽刺检测的准确性和泛化能力,推动了多模态理解和处理技术在复杂情感分析领域的应用。

【技术实现步骤摘要】

本专利技术涉及互联网,尤其涉及一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法


技术介绍

1、近年来,随着人工智能领域的蓬勃发展,机器学习、深度学习等技术在自然语言处理中的应用不断深化,推动了多模态数据处理能力的显著提升。特别是在社交媒体和网络平台上,用户生成的内容日益丰富,不仅包括文本信息,还涵盖了图像、视频等多种形式。这些多模态数据的增长,对自动化文本处理技术提出了更高的要求,促使研发更高效、更智能的算法来处理和理解这些复杂的信息。在这样的背景下,多模态讽刺检测技术应运而生。讽刺检测技术的发展,不仅对提高社交媒体内容的理解和分析能力具有重要意义,而且对于构建更加智能和人性化的交互系统也起到了关键作用,它在社交媒体监控与分析、个性化内容推荐、智能客服与交互等任务中展现出巨大的潜力,具有广阔的应用前景。

2、讽刺检测任务旨在识别和理解文本或语言中的讽刺语气或意图,这一任务在自然语言处理中具有重要地位和应用价值。讽刺检测被认为是自然语言处理中的一大挑战,因为讽刺语言通常依赖于复杂的语境和背景知识,这使得传统的文本分析方法难以捕捉其隐含的情本文档来自技高网...

【技术保护点】

1.本专利技术提供了一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法,并引入新的测试集RedEval评估模型在不同场景中的表现,在模型训练时,该方法包括:

2.如权利要求1所述的方法,其特征在于,所述步骤一中,将使用CLIP的文本和图像编码器获取图像和文本的嵌入表示计算如下:

3.如权利要求1所述的方法,其特征在于,所述步骤二中,当前输入与训练集中样本的相似度计算如下:

4.如权利要求1所述的方法,其特征在于,所述步骤二中,检索选择与当前输入最相似的图像-文本对的计算如下:

5.如权利要求1所述的方法,其特征在于,所述步骤七中,计算模...

【技术特征摘要】

1.本发明提供了一种基于视觉指令微调与演示学习增强的多模态讽刺检测方法,并引入新的测试集redeval评估模型在不同场景中的表现,在模型训练时,该方法包括:

2.如权利要求1所述的方法,其特征在于,所述步骤一中,将使用clip的文本和图像编码器获取图像和文本的嵌入表示计算如下:

3.如权利要求1所述的方法,其特征在于,所述步骤二中,当前输入与训练集中样本的相似度计算如下:

4.如权利要求1所述的方法,其特征在于,所述步骤二中,检索选择与当前输入最相似的图像-文本对的计算如下:

5...

【专利技术属性】
技术研发人员:李思唐炳豪闫浩龙林博达李嘉辰
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1