一种基于用户个性化特征的社交网络用户行为预测方法技术

技术编号:24169368 阅读:13 留言:0更新日期:2020-05-16 02:26
本发明专利技术公开了一种基于用户个性化特征的社交网络用户行为预测方法,首先基于若干社交网络用户的多维行为属性数据,构建不同类别的用户标记向量;对社交网络用户进行分类,划分为不同归属类别的用户,并对其行为进行行为特征向量转化,得到向量化后的用户行为;将向量化用户行为按时序排列,采用长短时记忆神经网络进行预测,所需预测结果;本发明专利技术对社交网络用户进行分类定义,对社交网络用户的类别及行为属性进行区分;对每一归属类别的用户行为的时序数据进行排序,通过对该类别用户行为数据的学习迭代来进行用户行为预测,降低了对预测过程中参数化的假设;充分考虑了社交网络用户在时序行为上的动态过程,提高了预测结果的真实性。

A prediction method of social network users' behavior based on users' personalized characteristics

【技术实现步骤摘要】
一种基于用户个性化特征的社交网络用户行为预测方法
本专利技术属于数据挖掘
,特别涉及一种基于用户个性化特征的社交网络用户行为预测方法。
技术介绍
在数据挖掘领域中,用户行为数据是一种非常重要的处理数据,用户行为数据是由用户在网络空间中的各种动态行为数据组成。随着互联网的迅速发展,社交网络在生活中越来越普及,用户的行为数据越来越多;同时,用户行为数据以及其行为产生者随着社会网络的发展以各种形式存在于各个网络;用户行为数据涉及用户时间、空间各个维度的数据,例如用户定位某个地点后发表推文或用户在某个时间点进行网页浏览等。由于网络的庞大性和用户的复杂性,这些用户的时空行为数据在各个社交网络上快速增长。在一个社交网络中,用户不仅拥有其自身的属性也随之产生与其相关的时序行为数据。如果我们能对用户的行为进行较为准确的预测,则可以针对用户进行一些商品推荐,好友推荐、信息转发或者信息扩散。现有的用户行为预测,更多的是针对于一些评论行为、购买意向、点击率以及转发行为预测,未考虑用户在时序上的一个长期行为;并且,以往的用户行为预测往往定焦于用户的某个特定行为上,未考虑用户的不同行为;同时,以往的方法参数化假设性强,缺乏考虑在线社交网络用户在时序行为上的动态过程。
技术实现思路
针对现有技术中存在的技术问题,本专利技术提供了一种基于用户个性化的社交网络用户行为预测方法,以解决现有技术中的用户行为预测未考虑用户在时序上的长期行为或定焦于用户的某个特定行为,参数化假设性强,缺乏考虑在线社交网络用户在时序行为上的动态过程的技术问题。为达到上述目的,本专利技术采用的技术方案为:本专利技术提供了一种基于用户个性化特征的社交网络用户行为预测方法,包括以下步骤:步骤1、基于若干社交网络用户的多维行为属性数据,构建不同类别的用户标记向量;步骤2、基于不同类别的用户标记向量,对社交网络用户进行分类,划分为不同归属类别的用户;步骤3、对每一归属类别的用户行为进行行为特征向量转化,得到向量化用户行为;将向量化用户行为按时序排列,并采用长短时记忆神经网络进行用户行为预测,得到社交网络用户的预测行为特征;对社交网络用户的预测行为特征进行解码,得到所需的用户行为。进一步的,步骤1中,构建不同类别的用户标记向量时,具体包括以下步骤:步骤11、提取若干个社交网络用户的多维行为属性数据,构建每个社交网络用户的用户属性特征向量;对每个用户属性特征向量进行归一化处理,得到每个社交网络用户的归一化用户属性特征向量;步骤12、利用聚类算法及先验知识,对每个社交网络用户的归一化用户属性特征向量的进行分类标记,得到不同类别的用户标记向量。进一步的,步骤1中,多维行为属性数据包括社交网络用户的动态数、点赞数、关注数、粉丝数、原创频率及转发频率。进一步的,步骤11中,对每个用户属性特征向量进行归一化处理时,采用对社交网络用户的每个行为属性数据利用归一化公式进行归一化处理。进一步的,步骤12中,对每个社交网络用户的归一化用户属性特征向量进行分类标记时,具体包括以下步骤:s1、选取k个社交网络用户的归一化用户属性特征向量作为初始对象;s2、分别计算每个社交网络用户的归一化用户属性特征向量到k个初始对象的距离,将社交网络用户的归一化属性特征向量与其距离最短的初始对象划归为一类,得到k类初步社交网络用户的归一化属性特征向量组;s3、计算步骤s2中的每一类初步社交网络用户的归一化属性特征向量组的中心,不断迭代,直至每类初步社交网络用户的归一化属性特征向量组的中心数据不发生改变,得到k类社交网络用户归一化属性特征向量;s4、结合先验知识对剔除后的k类社交网络用户归一化属性特征向量组中的行为属性数据进行标记,得到不同类别的用户标记向量。进一步的,步骤2中,采用SVM法、KNN法、随机森林法或朴素贝叶斯法对社交网络用户进行分类。进一步的,步骤2中,采用SVM法对社交网络用户进行分类时,具体包括以下步骤:步骤21、构建用户类型判别函数;步骤22、通过拉格朗日定理构建目标函数,采用SMO算法,求解用户类型判别函数;步骤23、利用步骤22中的判别函数对用户个性化特征进行判断,根据用户个性化特征的权重,将社交网络用户划分为不同归属类别的用户。进一步的,步骤21中,构建的判别函数为:f(x)=sign(Wtx+b);步骤22中,目标函数为:0≤αi≤C,i=1,2,...,N其中,W为权重参数,b为偏置参数,N为社交网络用户个数;x为用户的特征属性向量;xi为第i个用户的特征属性向量;xj为第j个用户的特征属性向量;yi为第i个用户的类别标签;yj为第j个用户的类别标签;αi为拉格朗日乘子;αj为拉格朗日乘子。进一步的,步骤3具体包括以下步骤:步骤31、对每一归属类别的用户的用户行为进行定义,利用one-hot方法,构建每一归属类别用户的用户行为特征向量;步骤32、将用户行为特征向量按照时序先后顺序排列,得到用户行为特征矩阵;步骤33、构建长短时神经网络,利用用户行为特征矩阵中的部分用户行为特征向量作为训练数据,其余数据作为测试数据;通过反向传播算法,对长短时神经网络进行参数更新;得到预测的用户行为向量;步骤34、对预测的用户行为向量进行解析,得到预测的用户行为。进一步的,步骤33中,选取用户行为特征矩阵中的50%-90%的用户行为特征向量作为训练数据。与现有技术相比,本专利技术的有益效果为:本专利技术提供了一种基于用户个性化特征的社交网络用户行为预测方法,基于若干社交网络用户的多维行为属性数据,通过对社交网络用户进行分类定义,对社交网络用户的类别及行为属性进行区分;对每一归属类别的用户行为的时序数据进行排序,通过对该类别用户行为数据的学习迭代来进行用户行为预测,降低了对预测过程中参数化的假设;充分考虑了社交网络用户在时序行为上的动态过程,提高了预测结果的真实性。本专利技术中通过对社交网络用户进行分类定义,提出对用户的有用分类定义,标记用户,增强用户标记的适用性。不同用户之间有着明显的行为特征,用户与行为之间存在着广泛的动态交互和相互影响,相似用户拥有类似的行为活动,对用户先分类再进行行为预测的用户个性化的社交网络的行为预测可以很好的捕捉这一特性。附图说明图1为本专利技术所述的基于用户个性化特征的社交网络用户行为预测方法流程示意图;图2为本专利技术所述的用户行为预测方法中的对社交网络用户分类过程的流程示意图;图3为本专利技术所述的用户行为预测方法中的行为预测过程流程示意图;图4为实施例1中所述的用户行为预测方法中用户分类准确率与训练数据曲线图图5为实施例1中所述的用户行为预测方法中行为预测结果准确率与训练数据的曲线图。具体实施方本文档来自技高网...

【技术保护点】
1.一种基于用户个性化特征的社交网络用户行为预测方法,其特征在于,包括以下步骤:/n步骤1、基于若干社交网络用户的多维行为属性数据,构建不同类别的用户标记向量;/n步骤2、基于不同类别的用户标记向量,对社交网络用户进行分类,划分为不同归属类别的用户;/n步骤3、对每一归属类别的用户行为进行行为特征向量转化,得到向量化用户行为;将向量化用户行为按时序排列,并采用长短时记忆神经网络进行用户行为预测,得到社交网络用户的预测行为特征;对社交网络用户的预测行为特征进行解码,得到所需的用户行为。/n

【技术特征摘要】
1.一种基于用户个性化特征的社交网络用户行为预测方法,其特征在于,包括以下步骤:
步骤1、基于若干社交网络用户的多维行为属性数据,构建不同类别的用户标记向量;
步骤2、基于不同类别的用户标记向量,对社交网络用户进行分类,划分为不同归属类别的用户;
步骤3、对每一归属类别的用户行为进行行为特征向量转化,得到向量化用户行为;将向量化用户行为按时序排列,并采用长短时记忆神经网络进行用户行为预测,得到社交网络用户的预测行为特征;对社交网络用户的预测行为特征进行解码,得到所需的用户行为。


2.根据权利要求1所述的一种基于用户个性化特征的社交网络用户行为预测方法,其特征在于,步骤1中,构建不同类别的用户标记向量时,具体包括以下步骤:
步骤11、提取若干个社交网络用户的多维行为属性数据,构建每个社交网络用户的用户属性特征向量;对每个用户属性特征向量进行归一化处理,得到每个社交网络用户的归一化用户属性特征向量;
步骤12、利用聚类算法及先验知识,对每个社交网络用户的归一化用户属性特征向量的进行分类标记,得到不同类别的用户标记向量。


3.根据权利要求1所述的一种基于用户个性化特征的社交网络用户行为预测方法,其特征在于,步骤1中,多维行为属性数据包括社交网络用户的动态数、点赞数、关注数、粉丝数、原创频率及转发频率。


4.根据权利要求2所述的一种基于用户个性化特征的社交网络用户行为预测方法,其特征在于,步骤11中,对每个用户属性特征向量进行归一化处理时,采用对社交网络用户的每个行为属性数据利用归一化公式进行归一化处理。


5.根据权利要求2所述的一种基于用户个性化特征的社交网络用户行为预测方法,其特征在于,步骤12中,对每个社交网络用户的归一化用户属性特征向量进行分类标记时,具体包括以下步骤:
s1、选取k个社交网络用户的归一化用户属性特征向量作为初始对象;
s2、分别计算每个社交网络用户的归一化用户属性特征向量到k个初始对象的距离,将社交网络用户的归一化属性特征向量与其距离最短的初始对象划归为一类,得到k类初步社交网络用户的归一化属性特征向量组;
s3、计算步骤s2中的每一类初步社交网络用户的归一化属性特征向量组的中心,不断迭代,直至每类初步社交网络用户的归一化属性特征向量组的中心数据不发生改变,得到k类社交网络用户归一化属性特征向量;
s4、结合先验知识对剔除后的k...

【专利技术属性】
技术研发人员:刘晓明李敏杰沈超周亚东管晓宏
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1