The invention discloses a method based on deep learning user sentiment analysis method, the method can include data preprocessing, word vector learning, text vector learning, user feature vector, user sentiment analysis and model updating. The method of the invention uses user published text information extraction of user feature vector, and based on the analysis of user characteristics based on text emotion to realize the user feature vector and vector information, the invention not only optimizes the complexity, user characteristics and learning user feature vector obtained has a rich user information based on the picture, the user feature vector and vector sentiment analysis on texts to enhance the accuracy and efficiency of sentiment analysis based on.
【技术实现步骤摘要】
一种基于深度学习的用户情感分析方法
本专利技术属于情感分析
,更具体地,涉及一种基于深度学习的用户情感分析方法。
技术介绍
随着互联网的快速发展,用户规模呈爆发式增长,同时促进了人们社交网络的形成与拓展。社交网络已经在我们的日常生活中成为不可代替的一部分。每个用户都可以随时把自己的心情,态度,观点发布于网络,也可以利用社交网络发现具有相同观念的好友,快速获取最新的知识。情感分析是数据挖掘领域的研究热点之一,传统的情感分析方法在进行文本相关特征提取时会产生一定的噪声或信息缺失,同时在情感预测方面也存在一定缺陷。基于深度学习的情感分析方法可以自动的学习并在模型中利用文本相关特征,然而现有深度学习方法对于文本的用户等信息利用不全面。用户情感分析的关键之一在于合理的利用用户信息。利用用户信息的分析任务通常是利用用户信息来提升情感分析的效果。或利用社交网络中用户的关注关系等发现社区或计算用户影响力,或利用用户的相关行为特征进行推荐。但传统的方法在利用用户的信息或用户表现的相关特征行为时均需要特征提取,而提取的特征不仅大多为离散的、多个不相关特征的叠加(如将用户的入度和 ...
【技术保护点】
一种基于深度学习的用户情感分析方法,其特征在于,包括以下步骤:对原始数据集中的所有用户及其发表的文本内容进行预处理得到目标数据集,对目标数据集中的单词进行训练得到各单词对应的词向量,对目标数据集中的文本进行训练得到各文本对应的文本向量;对于每个用户,基于用户ux的用户信息及用户ux发表的文本中单词的词向量(w1,w2,w3,...,wT),最大化概率
【技术特征摘要】
1.一种基于深度学习的用户情感分析方法,其特征在于,包括以下步骤:对原始数据集中的所有用户及其发表的文本内容进行预处理得到目标数据集,对目标数据集中的单词进行训练得到各单词对应的词向量,对目标数据集中的文本进行训练得到各文本对应的文本向量;对于每个用户,基于用户ux的用户信息及用户ux发表的文本中单词的词向量(w1,w2,w3,...,wT),最大化概率得到用户ux的第一特征向量,其中,wt表示词向量(w1,w2,w3,...,wT)中的任意词向量;最大化概率得到用户ux的第二特征向量,其中,N为用户数目,c为用户ux发表的文本内容的个数,tj为用户ux发表的第j个文本的文本向量;将用户ux的第一特征向量以及用户ux的第二特征向量进行拼接得到用户ux的目标特征向量,通过所有用户的目标特征向量对待分析用户进行情感分析。2.根据权利要求1所述的方法,其特征在于,所述对目标数据集中的文本进行训练得到各文本对应的文本向量,包括:对于目标数据集中的每段文本使用卷积神经网络学习将文本表示为与各文本对应的文本向量,其中,卷积神经网络的结构为:卷积神经网络的第一层输入文本对应的单词序列;卷积神经网络的第二层为对第一层输入的卷积操作,卷积操作使用多个filter得到多个特征层;卷积神经网络的第三层为池化层,对每个特征层向量取均值得到输出结果;卷积神经网络的第四层为线性层,输出长度为文本向量的长度;卷积神经网络的第五层为激活层,使用hTanh函数使得输出结果介于-1到1之间。3.根据权利要求2所述的方法,其特征在于,所述对于目标数据集中的每段文本使用卷积神经网络学习将文本表示为与各文本对应的文本向量,包括:设每个词向量的长度为d,输入文本序列s的句子长度为|s|,则卷积神经网络的第一层的输入矩阵记为S且卷积神经网络的第二层使用多个filter对每m个单词做卷积操作得到n个输出向量c,将n个输出向量c记为矩阵C,其中,将矩阵C作为卷积神经网络第三层池化层的输入,第三层对输入的每个向量c去均值,将矩阵转换为n维向量将作为卷积神经网络第四层的输入;设文本向量的输出长度也为d,则经过卷积神经网络第四层线性层后得到d维输出向量:其中y为第四层...
【专利技术属性】
技术研发人员:李瑞轩,文坤梅,昝杰,李玉华,辜希武,杨琪,代德顺,张镇,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。