图文讽刺识别模型训练方法、图文讽刺识别方法、计算机设备以及计算机可读存储介质技术

技术编号:41302364 阅读:23 留言:0更新日期:2024-05-13 14:49
本申请实施例公开了一种图文讽刺识别模型训练方法、图文讽刺识别方法以及相关设备,用于在提高图文讽刺识别准确性的情况下,进行图文讽刺识别模型训练。本申请实施例方法包括:生成目标提示模板,目标提示模板包含待识别文本、图像描述文本和语义识别结果,对目标提示模板进行分词处理,得到分词序列,将分词序列输入图文讽刺识别模型,由图文讽刺识别模型确定位置的分词映射在讽刺词表中得到的讽刺概率,及位置的分词映射在非讽刺词表中得到的非讽刺概率,以得到初始讽刺识别结果,基于语义识别结果与初始讽刺识别结果确定预测讽刺识别结果,当预测讽刺识别结果与标注的讽刺识别结果之间的损失满足收敛条件时,得到训练完成的图文讽刺识别模型。

【技术实现步骤摘要】

本申请实施例涉及图文讽刺识别领域,更具体的,是图文讽刺识别模型训练方法、图文讽刺识别方法、计算机设备以及计算机可读存储介质


技术介绍

1、讽刺是一种复杂的语言现象和特殊的情感表达形式,通常与某人真实意图的明显情感信息相反。由于讽刺语境中的真实情感与情感词等信息包含的情感相反,通常的情感识别模型可能难以正确识别讽刺的表达,因此需要进一步的讽刺识别模型来完善情感分析。在社交媒体中,比如论坛,用户常常通过发表带有配图的观点或评论,识别其中的讽刺表达需要同时依赖于文本和图像模态的信息。近两年来,面向图文的讽刺识别算法受到了广泛的关注和研究。

2、现有的图文讽刺识别方法是,可以获得待识别图像和待识别文本,其中,待识别图像和所述待识别文本对应描述相同事件,然后将待识别图像输入图像识别模型中,得到图像识别模型输出的待识别图像对应的情感信息,将待识别文本输入文本识别模型中,得到文本识别模型输出的待识别文本对应的情感信息,若待识别文本对应的情感信息与待识别图像对应的情感信息相反,则确定图文的情感表达为讽刺。

3、但是,在图文讽刺识别过程中,图像和文本文档来自技高网...

【技术保护点】

1.一种图文讽刺识别模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述生成目标提示模板之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述待识别文本、所述图像描述文本输入预先训练的语义识别模型之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述由图文讽刺识别模型确定所述位置的分词映射在讽刺词表中得到的讽刺概率,及所述位置的分词映射在非讽刺词表中得到的非讽刺概率,包括:

5.根据权利要求1所述的方法,其特征在于,所述由所述图文讽刺识别模型确定所述位置的分词映射在讽刺词表中...

【技术特征摘要】

1.一种图文讽刺识别模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述生成目标提示模板之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述待识别文本、所述图像描述文本输入预先训练的语义识别模型之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述由图文讽刺识别模型确定所述位置的分词映射在讽刺词表中得到的讽刺概率,及所述位置的分词映射在非讽刺词表中得到的非讽刺概率,包括:

5.根据权利要求1所述的方法,其特征在于,所述由所述图文讽刺识别模型确定所述位置的分词映射在讽刺词表中得到的讽刺概率,及所述位置的分词映射在非讽刺词表中得到的非讽刺概率,包括:

6.根据权利要求5所述...

【专利技术属性】
技术研发人员:杜嘉晨周蓝珺潘树燊
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1