A micro-blog sentiment prediction method based on multimodal hypergraph learning belongs to the field of multimodal emotion analysis. In view of the problems existing in the emotional prediction of multi-channel content of micro-blog, a sentiment prediction method based on multimodal hypergraph learning for micro-blog is proposed. The following steps are included: 1) to extract multi-modal features of micro-blog; 2) to calculate the distance between micro-blog; 3) to construct multimodal hypergraph model; 4) hypergraph learning. The better correlation of different modes to solve the independence between modes has a better effect on micro-blog sentiment prediction.
【技术实现步骤摘要】
一种基于多模态超图学习的微博情感预测方法
本专利技术属于多模态情感分析领域,尤其是涉及一种基于多模态超图学习的微博情感预测方法。
技术介绍
近来,随着新浪微博等大型社交平台的迅速发展,每天社交网络的多媒体数据规模不断增长,以新浪微博为例,截止2014年5月,新浪微博月活跃用户达到1.4亿,相比2013年12月增长了10.9%。作为最受欢迎的平台之一,新浪微博使得互联网用户能够在他们感兴趣的话题下表达他们的情感。因此,它吸引了大量的关于情感信息挖掘的研究,这些研究涉及一些新兴的应用包括事件检测、社交网络分析和商业推荐。微博发展的一个明显特征在于多模态信息的增长,比如图像、视频、短文本以及丰富的表情符号。主要原因在于越来越多的互联网用户使用越来越多样的设备来发布内容,也因此,发布图片和表情符号成为一种方便的形式,而非平白的文本。然而对于情感分析与预测,目前大多数的研究还是处于单一的文本通道,而非丰富的多模态信息。而根据认知科学的理论,对于情感分析,不同模态之间的差异性是很大的,不能作简单的融合,因此多模态分析是很有必要的。当前,微博情感分析方法主要利用纯文本通道信息,比如《一种基于大规模语料特征学习的微博情感分析方法(中国专利CN201510310710.9)》、《基于规则和统计模型的中文微博情感分析方法(中国专利CN201510127310.4)》、《一种融合显性和隐性特征的中文微博情感分析方法(中国专利CN201410723617.6)》、《一种中文微博的情感倾向分析方法(中国专利CN201310072472.3)》。然而,由于微博文本具有结构随意,内容较 ...
【技术保护点】
一种基于多模态超图学习的微博情感预测方法,其特征在于包括以下步骤:1)提取微博多模态特征;2)计算微博间距离;3)构建多模态超图模型;4)超图学习。
【技术特征摘要】
1.一种基于多模态超图学习的微博情感预测方法,其特征在于包括以下步骤:1)提取微博多模态特征;2)计算微博间距离;3)构建多模态超图模型;4)超图学习。2.如权利要求1所述一种基于多模态超图学习的微博情感预测方法,其特征在于在步骤1中,所述提取微博多模态特征的具体方法如下:步骤1.1对于文本模态,首先使用中科院自动分词工具ICTCLAS对微博文本内容进行分词,然后利用处理后的中文情感词典对分词后的每条微博文本构建词袋模型,作为最后筛选后的文本情感特征,所述中文情感词典由知网HowNet中文情感词典和台湾大学NTUSD中文情感词典组成,并筛选出在微博文本语料中出现的较高频度的2547个情感词,将其组成中文情感词典;第i条微博文本特征表示为Fibotw;步骤1.2对于视觉模态,首先提取图片底层视觉特征,包括局部二值模式特征、彩色直方图特征、GIST特征以及PHOW描述子词袋特征,然后使用形容词-动词对检测器库SentiBank对提取了底层视觉特征的每张微博图片进行中层特征的提取,获得1200个形容词-动词对的置信度值,并保留在0.8以上的置信度值,其余置为0,这样最终获得视觉情感特征;第i条微博图像特征表示为Fibovw;步骤1.3对于表情符号情感特征,首先收集文本语料里所有的表情符号,然后筛选出高频使用的49个表情符号,最后为每条微博构建表情符号词袋模型最为表情符号特征;第i条微博表情符号特征表示为Fiboew。3.如权利要求1所述一种基于多模态超图学习的微博情感预测方法,其特征在于在步骤2中,所述计算微博间距离的具体方法如下:对于文本、视觉、表情符号三个模态特征,都使用欧氏距离进行计算,得到所有任意两条微博间三种模态的距离,分别用距离矩阵表示为Distbotw,Distbovw和Distboew。4.如权利要求1所述一种基于多模态超图学习的微博情感预测方法,其特征在于在步骤3中,所述构建多模态超图模型的具体方法如下:步骤3.1计算不同模态下样本间的相似度,具体方法如下:使用欧式距离计算得到的三种模态下任意两条微博i和j间的情感距离,进而计算其相似度s(i,j);步骤3.2计算超图的关联矩阵...
【专利技术属性】
技术研发人员:纪荣嵘,曹冬林,陈福海,
申请(专利权)人:厦门大学,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。