一种基于表情包对比矛盾特征的文本反讽检测模型和方法技术

技术编号:42120192 阅读:37 留言:0更新日期:2024-07-25 00:38
本发明专利技术公开了一种基于表情包对比矛盾特征的文本反讽检测模型和方法,在提取了含有表情包文本中的文本特征和表情包语义特征后,根据文本特征和表情包语义特征来进一步来提取表情包与文本之间的对比矛盾特征,然后融合文本特征、表情包情感特征以及情包与文本之间的对比矛盾特征进行反讽预测,从而实现对含有表情包的文本进行反讽检测。

【技术实现步骤摘要】

本专利技术涉及文本情感分析领域,具体涉及一种基于表情包对比矛盾特征的文本反讽检测模型和方法


技术介绍

1、在当下主流的社交媒体平台上,反讽言论以其独特的语言形式和讽刺的内涵,被人们广泛使用。除了表达不满或批评,反讽还被网友用于掩饰真实情感、增加幽默及趣味、创造共鸣和连接等。因此,反讽检测对于提升在线交流质量有着重要的价值与意义。这不仅可以帮助更好地识别人们所要传递的潜在真实情感,而且学习到讽刺中矛盾的特征表达有助于机器更好地理解文本中隐含的情感表达。此外,融入反讽的说话风格能进一步帮助生成具有类人化的文本,并应用于智能客服等场景。

2、长期以来对反讽的理解和检测都是一项较困难的任务。反讽本身隐含的特点,即通常依赖于诸如讽刺、夸张和委婉等语言暗示,加上打上反讽标签的文本相对于普通文本较少,因此存在数据不平衡的问题,进而影响模型的训练和泛化性能。现有的一些反讽检测模型结合了上下文、多模态、说话人的习惯特点等辅助信息,然而这对于缺乏口头和面对面对话中情感线索的短文本,如社交媒体帖子,则是很难获取的。而若只对文本本身进行反讽检测很容易造成错误的判断。本文档来自技高网...

【技术保护点】

1.一种基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,包括一文本特征提取模块、一表情包语义特征提取模块、一对比矛盾特征捕获模块、一表情包情感特征提取模块、一特征融合模块以及一反讽特征预测模块;其中,

2.根据权利要求1所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,文本特征提取模块获取到输入的待检测文本后,通过词嵌入模型将输入的待检测文本映射为输入文本序列,然后通过预训练语言模型对输入文本序列中的各文本向量进行特征提取,从而得到待检测文本的文本特征;其中,文本特征包括传输到特征融合模块进行特征融合的句子级特征和传输到对比矛盾特征捕获模块进行对比矛盾特征提取...

【技术特征摘要】

1.一种基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,包括一文本特征提取模块、一表情包语义特征提取模块、一对比矛盾特征捕获模块、一表情包情感特征提取模块、一特征融合模块以及一反讽特征预测模块;其中,

2.根据权利要求1所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,文本特征提取模块获取到输入的待检测文本后,通过词嵌入模型将输入的待检测文本映射为输入文本序列,然后通过预训练语言模型对输入文本序列中的各文本向量进行特征提取,从而得到待检测文本的文本特征;其中,文本特征包括传输到特征融合模块进行特征融合的句子级特征和传输到对比矛盾特征捕获模块进行对比矛盾特征提取的单词级特征。

3.根据权利要求2所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,文本特征提取模块提取文本特征时,采用embedding作为词嵌入模型、albert作为预训练语言模型,通过以下公式对长度为m的输入文本序列s进行句子级特征和单词级特征的提取:

4.根据权利要求2所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,文本特征提取模块提取到句子级特征后,将提取到的句子级特征传输到特征融合模块进行融合,以获取特征融合向量;其中,文本特征提取模块在传输句子级特征之前,采用多头注意力机制来捕捉句子级特征中各词汇的注意力权重,从而得到多头注意力表示的句子级特征。

5.根据权利要求4所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,文本特征提取模块在计算多头注意力表示的句子级特征时,将句子级特征ts同时作为查询(q)、键(k)和数值(v),然后通过以下公式来计算多头注意力表示的句子级特征mha:

6.根据权利要求5所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,文本特征提取模块计算得到多头注意力表示的句子级特征mha后,通过一线性层将多头注意力表示的句子级特征mha映射到同一维度dw,从而得到编码后的句子级特征ft,并传输到特征融合模块进行特征融合;其中,文本特征提取模块通过以下公式对句子级特征mha进行编码:

7.根据权利要求2所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,文本特征提取模块提取到单词级特征后,采用双向长短期记忆网络bi-lstm进一步提取单词级特征的文本特征,得到联合上下文信息的单词级特征,然后将联合上下文信息的单词级特征传输对比矛盾特征捕获模块,用以捕获表情包语义与文本之间的对比矛盾特征;其中,文本特征提取模块通过以下公式提取联合上下文信息的单词级特征h:

8.根据权利要求1所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,表情包语义特征提取模块在提取待检测文本中所含表情包的表情包语义特征时,结合预训练语言模型和卷积神经网络来对表情包附加信息进行挖掘,然后对挖掘到的表情包附加信息进行融合,从而得到对应的表情包语义特征。

9.根据权利要求8所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,表情包附加信息包括表情包描述文本和表情包呈现图像;其中,表情包语义特征提取模块在进行表情包语义特征的提取时,通过预训练语言模型albert来提取表情包描述文本的描述文本语义特征,并通过卷积神经网络cnn来提取表情包呈现图像的呈现图像语义特征,然后通过一全连接网络层将提取到的描述文本语义特征和呈现图像语义特征进行融合,得到对应的表情包语义特征;其中,表情包语义特征提取模块通过以下公式来提取表情包的表情包语义特征:

10.根据权利要求9所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,表情包语义特征提取模块还包括一注意力层,用于提取包含有多个表情包的待检测文本的综合表情包语义特征,并将提取到的综合表情包语义特征作为表情包语义特征传输到对比矛盾特征模块进行对比矛盾特征提取;其中,表情包语义特征提取模块在提取综合n个表情包语义特征的综合表情包语义特征时,首先将表情包语义特征矩阵[e1;e2;…;en]中送入注意力层进行权重分配,得到权重矩阵[α1;α2;…,αk],然后基于分配的权重依次计算各表情包的重要性,并进行求和,从而得到最终的综合表情包语义特征ve,公式如下:

11.根据权利要求2所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,对比矛盾特征捕获模块获取到单词级特征和表情包语义特征后,采用对比注意力机制来捕获表情包语义与文本之间的对比矛盾特征;其中,对比矛盾特征捕获模块在进行对比矛盾特征捕获时,将联合上下文信息的单词级特征同时作为键(k)和数值(v),将表情包语义特征作为查询(q),通过以下公式计算文本和表情包之间的对比注意力,即矛盾对比向量r:

12.根据权利要求11所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,对比矛盾特征捕获模块获取到表情包语义和文本之间的矛盾对比向量r后,通过一线性层将矛盾对比向量r映射到同一维度dw,从而得到编码后的矛盾对比向量fr,并传输到特征融合模块进行特征融合;其中,对比矛盾特征捕获模块通过以下公式对矛盾对比向量r进行编码:

13.根据权利要求1所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,表情包情感特征提取模块提取表情包情感特征时,基于情感表示的表情包仓库将待检测文本中的表情包映射为表情包嵌入向量ew,然后采用双向长短期记忆网络bi-lstm对表情包嵌入向量进行特征提取,从而得到联合上下文信息的表情包情感特征he;其中,表情包情感特征提取模块通过以下公式提取表情包情感特征he:

14.根据权利要求13所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,表情包特征提取模块获取到联合上下文信息的表情包情感特征he后,通过一线性层将联合上下文信息的表情包情感特征he映射到同一维度dw,从而得到编码后的表情包特征fe,并传输到特征融合模块进行特征融合;其中,表情包特征提取模块通过以下公式对表情包情感特征he进行编码:

15.根据权利要求2所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,特征融合模块获取到单词级特征、表情包情感特征以及表情包语义与文本之间的对比矛盾特征后,采用门控多模态单元对获取到的单词级特征、表情包情感特征以及对比矛盾特征进行门控融合,从而得到特征融合向量。

16.根据权利要求15所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,门控多模态单元通过以下步骤获取到的单词级特征ft、表情包情感特征fe以及对比矛盾特征fr进行特征融合:

17.根据权利要求16所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,反讽特征预测模块获取到特征融合向量后,将特征融合向量输入到一全连接的预测层进行预测分类,得到一预测分类向量,然后根据输出的预测分类向量来确定反讽检测结果,公式如下:

18.根据权利要求1所述的基于表情包对比矛盾特征的文本反讽检测模型,其特征在于,反讽特征预测模块还可以单独利用表情包情感特征进行反讽预测,获取反讽检测结果;其中,表情包特征提取模块获取到编码后的表情包情感特征fe后,直接将表情包特征fe传输到反讽特征预测模块进行反讽预测,得到反讽检测结果计算公式如下:

19.一种基于表情包特征的文本反讽检测方法,其特征在于,包括以...

【专利技术属性】
技术研发人员:谭书华胥春石彭俊杰孙洋安露尹维月
申请(专利权)人:圆通速递有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1