当前位置: 首页 > 专利查询>浙江大学专利>正文

一种利用循环随机游走网络进行微博情感分类预测的方法技术

技术编号:17486066 阅读:65 留言:0更新日期:2018-03-17 10:26
本发明专利技术公开了一种利用循环随机游走网络进行微博情感分类预测的方法。主要包括如下步骤:1)针对于一组用户及微博博文数据集,构建用户之间及用户与微博博文之间相互关系的网络。并且针对于形成的网络,利用循环随机游走网络形成用户微博情感分类预测函数。2)对于得到的用户微博情感分类预测函数,产生对于用户微博情感的分类预测。相比于一般的用户微博情感分类解决方案,本发明专利技术能够同时利用微博博文的信息与用户之间的社交关系。本发明专利技术在微博情感分类预测问题中所取得的效果相比于传统的方法更好。

A method of using cyclic random walk network to predict micro-blog's emotion classification

The invention discloses a method of using a cyclic random walk network to carry out the micro-blog emotion classification and prediction. The main steps are as follows: 1) in view of a group of users and micro-blog data sets, the network between users and the relationship between users and micro-blog blog is built. And for the formation of the network, the use of cyclic random walk network to form the user micro-blog emotion classification prediction function. 2) for the obtained user micro-blog emotion classification prediction function, the classification prediction of users' micro-blog emotion is produced. Compared with the general user micro-blog emotion classification solution, the invention can simultaneously utilize the social relations between the micro-blog blog information and the user. The effect of the invention in the micro-blog emotion classification prediction problem is better than that of the traditional method.

【技术实现步骤摘要】
一种利用循环随机游走网络进行微博情感分类预测的方法
本专利技术涉及微博情感分类预测,尤其涉及一种利用循环随机游走网络进行微博情感分类预测的方法。
技术介绍
对于当前蓬勃发展的微博而言,用户微博情感预测是一项重要的问题。该项问题的目标是基于当前网络中已经观察到的用户关系及用户所发的微博的情感分类对于用户未来微博的情感分类进行预测。现有的技术主要是将微博情感分类当作一种文本情感分类任务来做,只是对于用户过去所发的微博进行训练,得到其用户微博的情感分类模型,从而预测未来该用户所发微博的情感分类,该方法受困于对于微博进行有效性表达的困难。本专利技术将利用一种异质微博情感分类网络进行用户微博情感分类的预测,该网络可以同时提取用户微博内容的深度语义表达与用户之间的社交关系,该网络附带有一随机游走层来学习异质微博语义分类网络映射,该网络可以从一开始便进行端到端的学习。
技术实现思路
本专利技术的目的在于解决现有技术中的问题,为了克服现有技术中缺乏对于用户微博博文的有效表达的问题,本专利技术提供一种利用循环随机游走网络进行微博情感分类预测的方法。本专利技术所采用的具体技术方案是:利用循环随机游走网络解决本文档来自技高网...
一种利用循环随机游走网络进行微博情感分类预测的方法

【技术保护点】
一种利用循环随机游走网络进行微博情感分类预测的方法,其特征在于包括如下步骤:1)针对于一组用户及微博,构建综合包括用户之间社交关系及用户与微博博文之间相互关系的网络;2)对于步骤1)所得到的社交网络,利用循环随机游走网络获取用户未来所发微博情感分类的交叉熵损失项与某用户在其他用户的影响下的所发微博博文的语义一致性损失项,并将这两者相加得到最终的损失项,通过学习,将这个最终的损失项最小化,来训练得到最终的用户微博情感分类预测函数;3)利用步骤2)学习得到的用户微博情感分类预测函数获取用户微博的预测情感分类。

【技术特征摘要】
1.一种利用循环随机游走网络进行微博情感分类预测的方法,其特征在于包括如下步骤:1)针对于一组用户及微博,构建综合包括用户之间社交关系及用户与微博博文之间相互关系的网络;2)对于步骤1)所得到的社交网络,利用循环随机游走网络获取用户未来所发微博情感分类的交叉熵损失项与某用户在其他用户的影响下的所发微博博文的语义一致性损失项,并将这两者相加得到最终的损失项,通过学习,将这个最终的损失项最小化,来训练得到最终的用户微博情感分类预测函数;3)利用步骤2)学习得到的用户微博情感分类预测函数获取用户微博的预测情感分类。2.根据权利要求1所述利用循环随机游走网络进行微博情感分类预测的方法,其特征在于所述的步骤2)其具体步骤为:2.1)对于步骤1)形成的综合包括用户之间社交关系及用户与微博博文之间相互关系的网络,利用预训练的单词映射网络、LSTM网络与softmax函数获得用户未来所发微博情感分类的交叉熵损失项;2.2)利用步骤1)形成的综合包括用户之间社交关系及用户与微博博文之间相互关系的网络,采用随机游走网络获取某用户在其他用户的影响下的所发微博博文的语义一致性的损失项,并结合步骤2.1)获得的用户未来所发微博情感分类的交叉熵损失项得到最终目标函数;2.3)利用步骤2.2)找出的最终目标函数,通过训练学习出所有用户的微博情感分类预测函数。3.根据权利要求2所述利用循环随机游走网络进行微博情感分类预测的方法,其特征在于所述的步骤2.1)具体为:针对于步骤1)获得的综合包括用户之间社交关系及用户与微博博文之间相互关系的网络,对于给定的微博博文,将其单词通过预先训练好的单词映射网络获取其单词映射;对于由一个单词序列构成的微博博文xi,设其第t个单词通过预先训练好的单词映射网络获取的单词映射为xit,则将序列(xi1,xi2,...,xik)作为微博博文xi的单词映射表达,之后,将博文xi分成若干段,并将各段的单词映射序列作为LSTM网络的输入,以LSTM网络的最后一个隐藏层的输出作为该段博文的映射表达,之后将各段的输出同时输入一个最大池化层,将池化层的输出ti∈Rd作为微博博文xi的映射表达,ti为一个d维向量;之后利用softmax函数来设计用户个性化情感分类模型,给定第j条微博博文的映射表达tj,则对于第i个用户的个性化语义函数如下:其中,c为所有的情感分类的种类数,向量为第j条微博博文的预测情感分类向量,fui(.)为所要学习出的对于第i个用户的某条微博的情感预测函数,u0∈Rd*c为对于所有用户的总体语义映射矩阵,ui∈Rd*c为对于第i个用户的特定语义映射矩阵,softmax(.)为softmax函数;则对于上式最终所得向量的每一维fu,k(tj),其由如下公式计算得到:其中u0,k与ui,k分别为u0与ui对应第k维的向量;再结合上一步得到的用户微博博文的情感预测向量与真实的训练集中的用户微博博文情感分类向量y,利用如下公式得到用户未来所发微博情感分类的交叉熵损失项:其中,集合Ai为第i个用户所有的微博博文构成的集合,为第j条微博的预测情感分类,yj为第j条微博的真实情感分类,m为总体用户数,对于yj向量,其只有对应于正确情感分类的维度值为1,其余维度的值为0...

【专利技术属性】
技术研发人员:赵洲孟令涛吴亦全蔡登何晓飞庄越挺
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1