【技术实现步骤摘要】
一种情感分析方法、设备及系统、计算机可读存储介质
本专利技术涉及一种情感分析方法、设备及系统、计算机可读存储介质。
技术介绍
21世纪是信息技术飞速发展的时代,人们的生活与计算机、互联网息息相关,人与人之间的交流和沟通方式也已渗透到网络中。以微博、微信为代表的社会化媒体平台的出现,更加使得移动互联深入人心。以微博为例,微博,即微博客的简称,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过web(网页)、WAP(WirelessApplicationProtocol,无线应用协议)以及各种客户端组件,以140字左右的文字发表信息,并实现即时分享。微博的简短、精辟吸引了大量的公众人物的使用,这些公众人物所带动的粉丝数以万计。每个人无论何时何地都可以自由而方便地记录生活的点滴、与朋友互动、表达观点等等。每一个微博传递的信息包含发布者的个人立场和感情,有必要对微博承载的参与者的感情进行挖掘分析。
技术实现思路
本专利技术至少一实施例提供了一种情感分析方法、设备及系统、计算机可读存储介质。为了达到本专利技术目的,本专利技术至少一实施例提供了一种情感分析方法,包括:根据语料生成词向量;根据所述语料生成特征向量,将所述词向量输入预先建立的第一长短记忆网络模型,将所述第一长短记忆网络模型输出的第一信息和所述特征向量输入预先建立的第二长短记忆网络模型;根据所述第二长短记忆网络模型输出的第二信息确定所述语料的情感倾向。本专利技术至少一实施例提供一种情感分析系统,包括:数据处理模块、存储模块和算法分析模块,其中:所述数据处理模块用于,获取语料;所述存储模块用于,存储所述 ...
【技术保护点】
1.一种情感分析方法,包括:根据语料生成词向量;根据所述语料生成特征向量,将所述词向量输入预先建立的第一长短记忆网络模型,将所述第一长短记忆网络模型输出的第一信息和所述特征向量输入预先建立的第二长短记忆网络模型;根据所述第二长短记忆网络模型输出的第二信息确定所述语料的情感倾向。
【技术特征摘要】
1.一种情感分析方法,包括:根据语料生成词向量;根据所述语料生成特征向量,将所述词向量输入预先建立的第一长短记忆网络模型,将所述第一长短记忆网络模型输出的第一信息和所述特征向量输入预先建立的第二长短记忆网络模型;根据所述第二长短记忆网络模型输出的第二信息确定所述语料的情感倾向。2.根据权利要求1所述的情感分析方法,其特征在于,所述根据语料生成特征向量前还包括,将待分析的目标信息预处理成预设格式的数据作为所述语料。3.根据权利要求1所述的情感分析方法,其特征在于,所述语料包括语料内容,或者,语料内容和语料类型;所述语料类型指示所述语料包含以下至少之一:正文、正文的评论和评论的回复。4.根据权利要求1所述的情感分析方法,其特征在于,所述根据所述语料生成词向量包括:将所述语料分词后生成一个或多个第一词向量,将所述第一词向量作为所述词向量;或,将所述语料分词后生成一个或多个第一词向量,基于所述语料所属的话题或分类生成第二词向量,将所述第一词向量和所述第二词向量组合得到所述词向量。5.根据权利要求1所述的情感分析方法,其特征在于,所述根据所述语料生成特征向量包括:根据所述语料提取特征信息,根据所述特征信息生成特征向量,所述特征信息包括以下至少之一:社交评论特征、情感表征特征和宏观社会特征,所述社交评论特征指示该语料的评论信息中是否存在该语料发布者的回复;所述情感表征特征指示所述语料及其评论信息中的包含的第一类情感符号和第二类情感符号的数量关系;所述宏观社会特征指示所述语料中是否出现提示其他用户查看该语料的提示用户信息。6.根据权利要求1所述的情感分析方法,其特征在于,所述词向量包括词向量x1(0)~x1(N-1);所述将所述词向量输入预先建立的第一长短记忆网络模型,将所述第一长短记忆网络模型输出的第一信息和所述特征向量输入预先建立的第二长短记忆网络模型包括:将词向量x1(0)输入所述第一长短记忆网络模型,将所述第一长短记忆网络模型输出的第一信息和所述特征向量输入所述第二长短记忆网络模型;将词向量x1(0)输入所述第一长短记忆网络模型,将所述第一长短记忆网络模型输出的第一信息和所述特征向量输入所述第二长短记忆网络模型;依次类推,将词向量x1(N-1)输入所述第一长短记忆网络模型,将所述第一长短记忆网络模型输出的第一信息和所述特征向量输入所述第二长短记忆网络模型,获取所述第二长短记忆网络模型输出的第二信息。7.根据权利要求1至6任一所述的情感分析方法,其特征在于,所述第一长短记忆网络模型和第二长短记忆网络模型基于如下方式建立:对训练语料进行情感倾向标注,基于所述训练语料对预设的第一初始长短记忆网络模型和所述第二初始长短记忆网络模型进行训练,得到所述第一长短记忆网络模型和所述第二长短记忆网络模型。8.根据权利要求1至6任一所述的情感分析方法,其特征在于,所述第一长短记忆网络模型如下:其中,所述为所述第一长短记忆网络模型的遗忘门t时刻的状态向量的第i个元素,所述σ为sigmod单元函数,所述为权重向量b1f的第i个元素、所述为权重矩阵U1f第i行、第j列的元素,所述为权重矩阵W1f的第i行、第j列的元素,所述为所述第一长短记忆网络模型的t时刻的输入向量的第j个元素,即t时刻输入的所述词向量第j个元素,所述为所述第一长短记忆网络模型t-1时刻的输出向量h1(t-1)的第j个元素;所述为所述第一长短记忆网络模型的输入门t时刻的状态向量的第i个元素,所述为权重向量b1g的第i个元素,所述为权重矩阵U1g第i行、第j列的元素,所述为权重矩阵W1g的第i行、第j列的元素;所述为所述第一长短记忆网络模型的输出门t时刻的状态向量的第i个元素,所述为权重向量b1q的第i个元素,所述为权重矩阵U1q第i行、第j列的元素,所述为权重矩阵W1q的第i行、第j列的元素;所述为所述第一长短记忆网络模型t时刻的中间状态向量s1(t)的第i个元素,所述为所述第一长短记忆网络模型t-1时刻的中间状态向量s1(t-1)的第i个元素,所述b1i为权重向量b1的第i个元素,所述U1i,j为权重矩阵U1第i行、第j列的元素,所述W1i,j为权重矩阵W1的第i行、第j列的元素;所述为所述第一...
【专利技术属性】
技术研发人员:胡晓,
申请(专利权)人:中兴通讯股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。