The invention discloses an image-text fusion micro-blog emotion analysis method based on in-depth learning, which is characterized by the following steps: S1 collects the image-text micro-blog data and preprocesses it; S2 extracts the image-text micro-blog text emotion characteristics; S3 extracts the image emotion characteristics of the image-text micro-blog; S4 carries out the image-text fusion micro-blog emotion analysis. By combining pictures and text in micro-blog, this method can more accurately judge the user's emotional orientation and improve the accuracy of emotional analysis.
【技术实现步骤摘要】
一种基于深度学习的图文融合微博情感分析方法
本专利技术属于情感分析领域,特别是涉及一种基于深度学习的图文融合微博情感分析方法。
技术介绍
随着网络技术的发展和移动设备的普及,人们与互联网的信息交互越来越频繁,各大社交网络平台的用户数量也不断增加,诸如新浪微博、Twitter和Facebook等社交网络平台已经成为了人们发表观点和记录生活的重要工具。通过挖掘用户发表在社交平台上海量信息所蕴含的情感将有助于舆情分析、个性化推荐和个性化搜索,因此,微博情感分析研究对于学术界和工业界具有巨大的科研价值和应用价值。现有的大多数情感分析研究主要以文本为主,然而用户在微博平台上发表的信息除了140字左右的短文本外,还包含了大量的符号表情、图片、语音和视频等多种形式的信息,这些不同形式的信息在情感分析中往往具有互补作用,充分地发挥这种互补作用,有时通过融合微博中多种形式的数据可以更加准确地判断用户的情感倾向。此外,目前的微博情感分析方法主要有基于情感词典的方法和基于机器学习的方法两种。基于情感词典的方法首先构建情感词典,然后根据新词与情感词典中词语的相似度来新词的情感极性,该方法受限于情感词典的覆盖面,尤其对于微博这样网络新词频现的社交媒体,更是难以应付;基于机器学习的方法主要采用SVM、K-means、NB等机器学习模型提取微博情感特征,然而由于微博的随意性和简短性,这些方法往往也效果不佳。
技术实现思路
本专利技术的目的是针对现有技术的不足,而提供一种基于深度学习的图文融合微博情感分析方法。这种方法通过结合微博中的图片和文本,能更加准确地判断用户的情感倾向,能提高情感分析 ...
【技术保护点】
1.一种基于深度学习的图文融合微博情感分析方法,其特征在于,包括如下步骤:S1采集图文微博数据并进行预处理:从微博上采集图文微博数据并进行预处理;S2提取图文微博文本情感特征:采用双向长短期记忆神经网络提取图文微博文本情感特征;S3提取图文微博图片情感特征:采用卷积神经网络提取图文微博图片情感特征;S4进行图文融合微博情感分析:融合步骤S2得到的文本情感特征和步骤S3得到的图片情感特征构建图文微博情感分类模型,进行图文融合微博情感分析。
【技术特征摘要】
1.一种基于深度学习的图文融合微博情感分析方法,其特征在于,包括如下步骤:S1采集图文微博数据并进行预处理:从微博上采集图文微博数据并进行预处理;S2提取图文微博文本情感特征:采用双向长短期记忆神经网络提取图文微博文本情感特征;S3提取图文微博图片情感特征:采用卷积神经网络提取图文微博图片情感特征;S4进行图文融合微博情感分析:融合步骤S2得到的文本情感特征和步骤S3得到的图片情感特征构建图文微博情感分类模型,进行图文融合微博情感分析。2.根据权利要求1所述的基于深度学习的图文融合微博情感分析方法,其特征在于,步骤S1中所述的预处理包括:S11:先采用网络爬虫采集微博数据、并进行过滤,只保留微博数据中的图文微博数据,然后采用人工标注的方式对图文微博进行情感标注,以此作为数据集;S12:采用中文分词工具jieba对微博文本进行分词处理,并采用word2vec工具在大规模语料上训练,将句子转化成对应的词向量矩阵,如果一条微博文本s由n个词语构成,经分词处理之后可表示为s=(w1,w2,w3,…,wn),将每个词语w表示为k维实数向量,则最终每条微博就表示为n×k的矩阵;S13:将图文微博中每张微博图片都归一化为227像素×227像素大小的RGB三通道图片。3.根据权利要求1所述的基于深度学习的图文融合微博情感分析方法,其特征在于,步骤S2中所述的提取图文微博图片情感特征包括:S21构建双向长短期记忆神经网络:所述双向长短期记忆神经网络包括Input层、LSTM层和全连接层组成,其中LSTM层包含t个LSTM单元,LSTM单元之间采用平行但方向相反的方式连接;S22训练双向长短期记忆神经网络:将微博文本数据集按照4:1比例拆分成训练集和测试集,在训练集上训练双向长短期记忆神经网络,设置Dropout率为0.5,即每次迭代中随机放弃一部分训练参数,双向长短期记忆神经网络采用Adam算法更新网络各层的参数,迭代次数为100代;S23利用训练好的双向长短期记忆神经网络模型提取微博文本特征:将m个n×k维矩阵表示的微博文本由Input层输入LSTM层,LSTM层的特征提取分为两个过程,第一个过程为在LSTM单元间的正向传播特征提取,第二个过程为在LSTM单元间的反向传播特征提取,最终将两个方向最后一个LSTM单元的输出连接后作为LSTM层最终的输出,正向传播和反向传播LSTM的计算公式如下:其中ct表示t时刻LSTM的单元状态,ht表示隐含状态,xt为输入,ct-1、ht-1和ct+1、ht+1表...
【专利技术属性】
技术研发人员:缪裕青,汪俊宏,刘同来,蔡国永,文益民,缪永进,邹魏,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:广西,45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。