【技术实现步骤摘要】
多维度细粒度动态情感分析方法及系统
[0001]本专利技术属于人工智能领域。
技术介绍
[0002]论坛、微博、微信等社交媒体的快速发展催生了众多数据分析产业,情感分析即为其中之一。通过分析社交媒体数据包含的情感信息,可准确分析和预测群体意见,在社会舆论、经济发展中发挥着重要作用。随着近几年短视频平台的兴起,新兴的视频信息和传统的文本、图片信息组成了主流的社交媒体信息模态。传统文本情感分析聚焦于单个模态,包含的信息维度有限且单一,无法分析视频或图片数据等包含多模态的情感;针对多模态数据的情感分析应运而生,多模态情感分析对多个模态的数据进行处理和分析,包含多维度信息,从多个维度互相补充信息,从而获得更加准确的结果。多模态情感分析中,不同模态数据间的模态融合是核心,目前,多模态数据融合的主流方法主要包括:
[0003]1)特征级融合:特征级融合将多个独立的数据集融合成一个单一的特征向量,然后输入到分类模型中,多模态数据的特征级融合往往无法充分利用多个模态数据间的互补性,且通常包含大量冗余信息。
[0004]2)决 ...
【技术保护点】
【技术特征摘要】
1.一种多维度细粒度动态情感分析方法,其特征在于,包括以下步骤:利用多模态数据相关经验,对缺失数据进行预测补全;对文本进行实体级的情感分析,得到针对不同实体的情感,并利用实体分割的结果对所述多模态数据进行二次切割;分别计算文本音频图像多模态的特征;利用所述多模态数据的融合特征,用训练好的分类模型预测情感;基于实体的历史情感数据,预测所述实体未来情感走向。2.根据权利要求1所述的方法,其特征在于,所述利用数据相关经验,对缺失数据进行预测补全,包括:利用多模态数据在不同模态间存在一定关联关系的特点,采用Seq2Seq模型来实现缺失模态的信息补全,根据已知模态的输入序列预测缺失模态的信息。3.根据权利要求1所述的方法,其特征在于,所述对文本进行实体级的情感分析,包括:根据上下文从同一文本中对情感进行更细粒度推断,给定文本可以有不同的分析目标和不同Aspect,每个目标和Aspect关联不同情感;采用预训练模型Bert,利用其Transformer模型中的编码器模块和解码器模块对输入的文本进行特征表示;将上下文添加到自注意力模型中,学习在不同上下文中分配注意力。4.根据权利要求1所述的方法,其特征在于,利用所述多模态数据的融合特征,用训练好的分类模型预测情感,其中,对于相互影响作用较强的模态,采用特征级融合的方式,对于相互影响较弱的模态,采用决策级融合的方式。5.根据权利要求1所述的方法,其特征在于,所述基于实体的历史情感数据,预测所述实体未来走向,包括:根据确定的时间步长将历史消息进行情感特征提取,对情感倾向特征序列进行划分,构造训练样本相乘训练集;对每个样本取时间序列上固定长度的一段时间作为目标,使用LSTM模型,学习训练集种的相关特征;使用模型对将来一段时间内的情感变化趋势进行预测。6.一种多维度细粒度动态情感分...
【专利技术属性】
技术研发人员:欧中洪,陆舸帆,田中一,胡塞尔,宋美娜,钟茂华,梁昊光,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。