一种基于多面排序网络解决推文预测转发任务的方法技术

技术编号:19277568 阅读:23 留言:0更新日期:2018-10-30 18:04
本发明专利技术公开了一种基于多面排序网络解决推文预测转发任务的方法。主要包括如下步骤:1)针对于一组用户及推特推文数据集,构建用户之间及用户与推文之间相互关系的网络。并且针对于形成的网络,利用多面排序网络形成用户推文转发预测函数。2)对于得到的用户推文转发预测函数,产生对于用户推文转发的概率预测。相比于一般的用户推文转发的概率预测解决方案,本发明专利技术能够同时利用推文的信息与用户之间的相互影响关系。本发明专利技术在推文转发预测问题中所取得的效果相比于传统的方法更好。

A method of solving tweets prediction forwarding task based on multi face sorting network

The invention discloses a method for solving the tweets prediction forwarding task based on the multi face sorting network. The main steps are as follows: 1) For a group of users and Twitter datasets, build a network between users and the relationship between users and Twitter. And for the network formed, the user's tweets forwarding function is formed by using the multi face sorting network. 2) for the user's tweets forwarding function, the probability prediction for user tweets is generated. Compared with the general probability prediction solution of user tweet forwarding, the present invention can simultaneously utilize the interaction relationship between tweet information and users. The invention achieves better results in pushing text forwarding prediction problems than traditional methods.

【技术实现步骤摘要】
一种基于多面排序网络解决推文预测转发任务的方法
本专利技术涉及推文转发预测任务,尤其涉及一种基于多面排序网络解决推文预测转发任务的方法。
技术介绍
随着以社交关系为基础的网站的蓬勃发展,对于用户推文转发情况的预测也成为一项具有挑战性的工作,该任务的目的是对于某一用户预测其转发所关注的用户推文的概率大小,但是目前已有的预测方法效果并不是很好。现有的技术主要是利用推文的文本信息预测未来的用户推文分享情况,但是随着移动式设备的逐渐普及,越来越多的推文开始带有图片,所以在预测推文转发情况时,将推文中的图片信息也考虑进去便成为一项非常重要的任务。本专利技术将首先利用已有的用户、推文之间的关系及用户之间的相互关系构建社交媒体网络,之后通过卷积神经网络与LSTM网络来分别获取推文的图片及文本的语义表达,利用随机初始化得到用户表达,之后结合用户表达及推文文本及图片的表达得到关于用户本身对于该推文感兴趣程度的损失值。之后通过构建的社交关系网络中的用户之间相互关注的关系,得到用户之间相互影响大小,并利用该影响力数值结合用户表达与推文表达得到反映在用户之间相互影响的前提下用户对于推文感兴趣程度的损失项值。将用户本身对于该推文感兴趣程度的损失值与反映在用户之间相互影响的前提下用户对于推文感兴趣程度的损失项值结合,得到最终的损失目标函数,经过训练,得到用户对于某推文感兴趣程度的大小,并利用该值预测用户对于推文的转发概率。
技术实现思路
本专利技术的目的在于解决现有技术中的问题,为了克服现有技术中仅仅关注到推文中的文本没有关注推文中的图片且没有加入反映用户之间相互影响力的问题,本专利技术提供一种基于多面排序网络解决推文预测转发任务的方法。本专利技术所采用的具体技术方案是:基于多面排序网络解决推文预测转发任务的方法,包含如下步骤:1、针对于一组社交网络用户及其对于的推文转发情况,构建包含用户、推文之间相互关系的社交媒体网络。2、对于步骤1所得到的社交媒体网络中的带有图片的推文,利用卷积神经网络获取推文图片的表达,利用单词映射网络及LSTM网络获取推文文本的语义表达,利用随机初始化获取用户的映射表达。之后结合推文的图片及文本表达获取推文的综合表达,利用推文的综合表达及用户的表达获取反映用户本身对于推文感兴趣程度大小的值。利用步骤1构建的社交媒体网络中的用户之间相互关注的关系及用户表达矩阵,得到用户相互影响力分数,并利用该分数与用户表达及推文综合表达得到反映结合了用户之间相互影响的用户对于推文感兴趣程度的值。两者结合得到最终的损失函数。3、利用所获得的含有用户推文转发关系及用户间关系的数据集,针对步骤2所得的损失函数,经过训练,得到最终的损失函数,根据该函数可以对于任意用户及其关注的用户发出的任意推文进行排序,将更可能被用户转发的推文排在前列。上述步骤可具体采用如下实现方式:1、对于所给出的用户及用户所发的微博,按照实际数据集中的用户之间社交关系及用户与微博博文的发布关系形成社交媒体网络。2、对于所给出的推文,利用如下方法获取带有图片的推文的综合表达:对于推文中的图片,输入到卷积神经网络中获取对应图片的表达,对于图片ii,输入到卷积神经网络中获取其对应表达xi。对于给定的微博博文,将其单词通过预先训练好的单词映射网络获取其单词映射。对于由一个单词序列构成的微博博文di,设其第t个单词通过预先训练好的单词映射网络获取的单词映射为xit,则将序列(xi1,xi2,...,xik)作为微博博文xi的单词映射表达,之后,将博文di分成若干段,并将各段的单词映射序列作为LSTM网络的输入,以LSTM网络的最后一个隐藏层的输出作为该段博文的映射表达,之后将各段的输出同时输入一个最大池化层,将池化层的输出yi作为微博博文di的映射表达。3、利用多模态混合函数来得到推文的图片与文本的混合表达,给定第i条推文的图片表达映射xi与推文中的文本表达yi,则该推文的综合表达如下:zi=g(W(i)xi+W(d)yi)其中,W(i)与W(d)为该混合函数用来混合推文的图片表达与文本表达的权重矩阵,g(.)为非线性的双曲正切激活函数。4、通过随机初始化得到用户的映射矩阵U={u1,u2,...,ul},其中up代表了用户p的映射向量,利用如下公式获取用户p本身对于推文i的感兴趣程度大小值:5、利用如下公式获取用户p受到其所关注的用户q的影响力大小:spq=p·tanh(W(s)up+W(n)uq+b)其中,up代表了用户p的映射向量,uq代表了用户p所关注的用户q的映射向量,W(s)与W(n)为用来反映用户q对于用户p影响力大小的权重矩阵,b为偏置向量,tanh(.)为非线性的双曲正切激活函数。p为用来计算影响力分数大小的参数向量。针对于用户p会关注多个用户,则针对于用户p关注的用户集合Np中的每一个用户q,用户q对于用户p的相对影响力分数大小为;6、利用步骤5获取的用户p对于用户q的影响力权重α,与步骤4所得到的用户p本身对于推文i的感兴趣程度大小,得到用户p在其所关注的所有用户的影响下,对于推文i感兴趣程度的大小值为:则结合步骤4所得到的用户p本身对于推文i的感兴趣程度大小可以得到用户p对于推文i转发的概率大小为:7、给定包含用户之间相互关注关系与用户推文的数据集合(j,i,k,Nj),该集合表示用户j对于推文i的转发概率高于对于推文k的转发概率,且用户i所关注的用户集合为Nj。同时给定步骤6所得的针对于数据集合(j,i,k,Nj)中的所有用户j的转发概况函数则可以构建最终的带注意力机制的多模态排序损失函数:其中,为用户j对于未转发的推文k的转发概率值,为用户j对于转发的推文i的转发概率值,c代表损失函数中的间隔值。8、则结合模型中所有参数作为损失项,可得到最终的损失函数如下:其中,Ψ为模型中的所有参数构成的集合,β为对于步骤7所得的带注意力机制的多模态排序损失函数损失项与模型参数值损失项的权衡参数,(j,i,k,Nj)为模型对应的所有代表用户j对于推文i的转发概率高于对于推文k的转发概率的数据集合。9、对于步骤8中的最终的目标函数,本专利技术使用随机梯度下降的方法来更新参数,并且使用Adagrad的学习率更新方法进行网络中的所有参数的更新,获取最终的任意用户j的推文转发概率预测函数10、利用步骤9所形成的推文转发概率预测函数对于某一用户所关注的用户转发的推文,求得该用户对于所关注用户转发推文的转发概率大小,将具有最大转发概率的推文作为该用户最可能转发的推文,对于该用户关注的用户转发的所有推文进行排序。附图说明图1是本专利技术所使用的用于解决推文预测转发任务的多面排序网络模型。具体实施方式下面结合附图和具体实施方式对本专利技术做进一步阐述和说明。如图1所示,本专利技术基于多面排序网络解决推文预测转发任务的方法包括如下步骤:1)针对于一组社交网络用户及其对于的推文转发情况,构建包含用户、推文之间相互关系的社交媒体网络;2)对于步骤1)所得到的社交媒体网络的带有图片的推文,利用卷积神经网络获取推文图片的表达,利用单词映射网络及LSTM网络获取推文文本的语义表达,利用随机初始化获取用户的映射表达;之后结合推文的图片及文本表达获取推文的综合表达,利用推文的综合表达及用户的表达获取反映用户本身本文档来自技高网...

【技术保护点】
1.一种基于多面排序网络解决推文预测转发任务的方法,其特征在于包括如下步骤:1)针对于一组社交网络用户及其对于的推文转发情况,构建包含用户、推文之间相互关系的社交媒体网络;2)对于步骤1)所得到的社交媒体网络的带有图片的推文,利用卷积神经网络获取推文图片的表达,利用单词映射网络及LSTM网络获取推文文本的语义表达,利用随机初始化获取用户的映射表达;之后结合推文的图片及文本表达获取推文的综合表达,利用推文的综合表达及用户的表达获取反映用户本身对于推文感兴趣程度大小的值;利用步骤1)构建的社交媒体网络中的用户之间相互关注的关系及用户表达矩阵,得到用户相互影响力分数,并利用该分数与用户表达及推文综合表达得到反映结合了用户之间相互影响的用户对于推文感兴趣程度的值;两者结合得到最终的损失函数;3)利用所获得的含有用户推文转发关系及用户间关系的数据集,针对步骤2)所得的损失函数,经过训练,得到最终的损失函数,根据该函数可以对于任意用户及其关注的用户发出的任意推文进行排序,将更可能被用户转发的推文排在前列。

【技术特征摘要】
1.一种基于多面排序网络解决推文预测转发任务的方法,其特征在于包括如下步骤:1)针对于一组社交网络用户及其对于的推文转发情况,构建包含用户、推文之间相互关系的社交媒体网络;2)对于步骤1)所得到的社交媒体网络的带有图片的推文,利用卷积神经网络获取推文图片的表达,利用单词映射网络及LSTM网络获取推文文本的语义表达,利用随机初始化获取用户的映射表达;之后结合推文的图片及文本表达获取推文的综合表达,利用推文的综合表达及用户的表达获取反映用户本身对于推文感兴趣程度大小的值;利用步骤1)构建的社交媒体网络中的用户之间相互关注的关系及用户表达矩阵,得到用户相互影响力分数,并利用该分数与用户表达及推文综合表达得到反映结合了用户之间相互影响的用户对于推文感兴趣程度的值;两者结合得到最终的损失函数;3)利用所获得的含有用户推文转发关系及用户间关系的数据集,针对步骤2)所得的损失函数,经过训练,得到最终的损失函数,根据该函数可以对于任意用户及其关注的用户发出的任意推文进行排序,将更可能被用户转发的推文排在前列。2.根据权利要求1所述基于多面排序网络解决推文预测转发任务的方法,其特征在于所述的步骤2)其具体步骤为:2.1)对于所给出的推文,利用如下方法获取带有图片的推文的综合表达:对于推文中的图片,输入到卷积神经网络中获取对应图片的表达,对于图片ii,输入到卷积神经网络中获取其对应表达xi;对于给定的微博博文,将其单词通过预先训练好的单词映射网络获取其单词映射。对于由一个单词序列构成的微博博文di,设其第t个单词通过预先训练好的单词映射网络获取的单词映射为xit,则将序列(xi1,xi2,...,xik)作为微博博文xi的单词映射表达,之后,将博文di分成若干段,并将各段的单词映射序列作为LSTM网络的输入,以LSTM网络的最后一个隐藏层的输出作为该段博文的映射表达,之后将各段的输出同时输入一个最大池化层,将池化层的输出yi作为微博博文di的映射表达;2.2)利用多模态混合函数来得到推文的图片与文本的混合表达,给定第i条推文的图片表达映射xi与推文中的文本表达yi,则该推文的综合表达如下:zi=g(W(i)xi+W(d)yi)其中,W(i)与W(d)为该混合函数用来混合推文的图片表达与文本表达的权重矩阵,g(.)为非线性的双曲正切激活函数;2.3)通过随机初始化得到用户的映射矩阵U={u1,u2,.....

【专利技术属性】
技术研发人员:俞新荣
申请(专利权)人:杭州一知智能科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1