一种天气特征对用户签到影响的度量方法技术

技术编号:18593306 阅读:67 留言:0更新日期:2018-08-04 20:10
本发明专利技术涉及一种天气特征对用户签到影响的度量方法,该方法包含如下步骤:S1:通过历史数据分析找到对用户签到影响较大的天气特征;S2:对找到的历史数据中的天气特征进行高斯拟合并计算签到地点的历史天气得分;S3:选择神经网络;S4:将所述历史天气得分分为训练集和测试集,并对所述神经网络进行学习和训练;S5:对训练好的神经网络通过所述测试集进行测试;S6:将当前的天气特征作为输入,通过训练出的神经网络计算出当前的天气得分。本发明专利技术考虑了以前没考虑到的天气特征对用户签到的影响,通过计算用户当前可达地点的天气得分就能很好的预测其下一个兴趣点。

A method for measuring the impact of weather characteristics on user check-in

The present invention relates to a measure of weather characteristics affecting user signature, which includes the following steps: S1: through historical data analysis, the weather features that affect user signature are found; S2: Gauss fitting for the weather features found in the historical data and counting the historical weather score of the sign to sign the place; S3: Select the neural network; S4: divide the historical weather score into a training set and a test set, and learn and train the neural network. S5: the trained neural network is tested through the test set; S6: the current weather features are used as input to calculate the current weather through the trained neural network. Score. The present invention takes into account the influence of the weather features that have not been considered before, and can predict the next interest point well by calculating the weather score of the user's current reachable location.

【技术实现步骤摘要】
一种天气特征对用户签到影响的度量方法
本专利技术属于数据分析
,涉及一种天气特征对用户签到影响的度量方法。
技术介绍
随着互联网的迅速发展,基于地理位置服务的网络应用越来越普遍,特别是随着LBSN的产生,人们可以随时在网上通过签到来记录和分享自己的位置信息,分享自己对当前兴趣点的评论信息和体验感觉。这些基于位置的社交网站收集了大量用户的签到信息,并且人们可以轻易的获取这些信息;使得基于签到记录的数据来预测用户的下一个兴趣点成为研究的热点,通过用户的签到历史记录来对用户的行为进行预测,商家可以早一步了解用户的兴趣点倾向,提前做出准备,由此带来更多的利润,因此,兴趣点预测的研究具有重要的意义。基于地理位置社交网络的签到受到许多因素的影响。现有的技术,大多考虑时间、空间因素对用户签到位置的影响,通过矩阵因子分解,张量分解,利用马尔科夫链进行建模,来预测用户的移动,以及通过用户与朋友签到位置的相似性进行社交关系建模并根据该模型预测用户的下一个兴趣点。现有基于位置的预测技术没有充分考虑到客观因素天气对用户签到地点的影响,比如公开号为CN104680250A、名称为“一种位置预测系统”的国内专利技术专利就只考虑了社交关系对用户签到位置的影响,若某地的天气很糟,则用户去往此可达地点的概率就很小。
技术实现思路
有鉴于此,本专利技术的目的在于考虑了现有技术没考虑到的天气特征对用户签到的影响,并提供一种天气特征对用户签到影响的度量方法。为达到上述目的,本专利技术提供如下技术方案:一种天气特征对用户签到影响的度量方法,该方法包含如下步骤:S1:通过历史数据分析找到对用户签到影响较大的天气特征;S2:对找到的历史数据中的天气特征进行高斯拟合并计算签到地点的历史天气得分;S3:选择神经网络;S4:将所述历史天气得分分为训练集和测试集,并对所述神经网络进行学习和训练;S5:对训练好的神经网络通过所述测试集进行测试;S6:将当前的天气特征作为输入,通过训练出的神经网络计算出当前的天气得分。进一步,所述步骤S1具体为:S11:通过柱状图分析历史数据中的降雨、风速、温度与签到的数学分布关系;S12:通过统计Gowalla的散点图和块状分布,找到历史数据中用户签到最密集地点的天气状况,从而确定对用户签到影响大的天气特征。进一步,步骤S2包含:S21:对找到的历史数据中的天气特征进行高斯拟合:f(x)=a·exp(c(x-d)2)其中,f(x)为高斯拟合函数,a、c、d为参数,x为天气特征变量,S22:将高斯函数的形式转化为矩阵乘法的形式,利用最小二乘法计算出参数a、c、d;S23:对用户历史数据中的每一条签到记录所含的天气特征,定义温度特征T的得分为:定义降雨特征p的得分为:定义风速特征w的得分为:定义用户每条签到记录的天气得分为:Pweather=P(p)·P(w)·P(T)其中,Pweather为天气得分。进一步,步骤S3中所述神经网络为三层结构,包括神经网络依次连接的输入层、隐藏层和输出层,其中所述隐藏层的神经元的数量为12。进一步,步骤S4具体为:S41:随机抽取70%的历史数据的天气信息及对应天气得分作为训练集;S42:将训练集数据处理,归一化为[-1,1]之间的数据作为神经网络的输入数据,其中No归一化结果,Dn为所处理的第n个数据,Dmax、Dmin分别为训练集数据中的最大值和最小值;S43:选择sigmoid函数作为隐藏层的激活函数,对神经网络进行学习和训练。进一步,步骤S43中对神经网络进行学习所选取的参数包含学习率、训练步长、初始的权值、阈值、激活函数和学习算法,由所述激活函数获得的天气得分函数为:其中a0,b0分为加入神经网络中输入层和隐藏层的偏置变量,为不同输入层的权重,g为线性函数,为sigmoid函数。aj分别表示a1为温度,a2为降雨,a3为风速。进一步,所述步骤S5包含:S51:选取15%的历史数据的天气信息及对应天气得分作为测试集,15%的历史数据的天气信息及对应天气得分作为验证集;S52:将测试集和验证集输入神经网络,对神经网络的准确性进行评估。进一步,步骤6包含如下步骤:S61:地点Xk通过神经网络计算出在t+1时刻天气得分即:其中,表示可达地点Xl的集合,Xl表示用户u在时间t所在的地点,Xk是Xl的可达地点,S表示所有地点集合,表示用户在t+1时刻不可到达Xk并且天气得分为0,表示t+1时刻用户访问地点Xk。S62:汇总所有天气得分,得到用户u在t+1时刻所有地点的天气向量;S63:将t+1时刻所有地点的天气向量进行从大到小排列为:从而预测用户的下一个兴趣点,其中,u为用户,t为时刻,表示神经网络计算出的在t+1时刻地点Xk的天气得分,m为可达地点总数。本专利技术的有益效果在于:本专利技术提供了一种计算天气特征对用户签到影响的度量方法,考虑了客观因素天气特征对用户签到的影响,贴近实际生活,若某一可达地点的天气很糟糕,则用户去该地的概率就很小,由此可以预测用户的下一个兴趣点。附图说明为了使本专利技术的目的、技术方案和有益效果更加清楚,本专利技术提供如下附图进行说明:图1为本专利技术的总体流程图;图2为计算天气得分的神经网络结构图图3为SPSS相关性分析结果图;图4为天气预测结果图。具体实施方式下面将结合附图,对本专利技术的优选实施例进行详细的描述。本专利技术为一种天气特征对用户签到影响的度量方法,通过分析签到数据找到除时间、空间、社交关系之外对用户签到影响较大的客观因素天气特征,并对每类天气特征进行高斯拟合,通过选择合适的神经网络结构模型、训练神经网络来计算签到地点的天气得分,如图1所示,分为如下步骤:步骤一:通过数据分析,找到对用户签到影响较大的天气特征为,降雨、风速、温度,对找到的天气特征进行高斯拟合,计算出其参数。步骤二:对给定的每类天气特征计算出得分,从而得到签到地点的天气得分pweather,由此计算出每条签到记录的天气得分。步骤三:选择合适的神经网络结构。步骤四:选择合适的数据与参数对BP神经网络进行学习和训练。步骤五;采用测试样本数据对模型进行测试。步骤六:利用训练出的BP神经网络来计算签到地点的天气得分,具体步骤如下。步骤一中:通过柱状图找出天气特征与签到成正态分布,通过其两两对比,分别统计Gowalla散点图和块状图的情况,找出签到最密集时的天气特征,且他们互相之间成弱相关。对每类天气特征进行高斯拟合,形为:f(x)=a·exp(c(x-d)2),以温度为例,x为数据中出现的温度,y为对应温度出现的次数,则yi=a·exp(c(xi-d)2),通过对该函数两边取对数,然后形式化为矩阵乘法,利用最小二乘法原则来计算未知参数a,c,d从而得到该函数。步骤二:基于步骤一得到的函数f(x),对给定温度T的得分定义为:相同的,降雨p(p)和风速p(w)也进行类似的定义,由于它们互相之间弱相关,如图2所示,则可以将签到记录地点的天气得分定义为:Pweather=P(p)·P(w)·P(T),因而就能计算出数据集中每条签到记录的Pweather。步骤三:确定神经网络模型的结构时,包括确定神其输入、输出的参数,隐藏层的个数以及神经元的数目。本实施例的神经网络为常用的隐藏层为一层的BP神经网络,其为三层网络结构,其中隐藏层本文档来自技高网...

【技术保护点】
1.一种天气特征对用户签到影响的度量方法,其特征在于:该方法包含如下步骤:S1:通过历史数据分析找到对用户签到影响较大的天气特征;S2:对找到的历史数据中的天气特征进行高斯拟合并计算签到地点的历史天气得分;S3:选择神经网络;S4:将所述历史天气得分分为训练集和测试集,并对所述神经网络进行学习和训练;S5:对训练好的神经网络通过所述测试集进行测试;S6:将当前的天气特征作为输入,通过训练出的神经网络计算出当前的天气得分。

【技术特征摘要】
1.一种天气特征对用户签到影响的度量方法,其特征在于:该方法包含如下步骤:S1:通过历史数据分析找到对用户签到影响较大的天气特征;S2:对找到的历史数据中的天气特征进行高斯拟合并计算签到地点的历史天气得分;S3:选择神经网络;S4:将所述历史天气得分分为训练集和测试集,并对所述神经网络进行学习和训练;S5:对训练好的神经网络通过所述测试集进行测试;S6:将当前的天气特征作为输入,通过训练出的神经网络计算出当前的天气得分。2.根据权利要求1所述的一种天气特征对用户签到影响的度量方法,其特征在于:所述步骤S1具体为:S11:通过柱状图分析历史数据中的降雨、风速、温度与签到的数学分布关系;S12:通过统计Gowalla的散点图和块状分布,找到历史数据中用户签到最密集地点的天气状况,从而确定对用户签到影响大的天气特征。3.根据权利要求2所述的一种天气特征对用户签到影响的度量方法,其特征在于:步骤S2包含:S21:对找到的历史数据中的天气特征进行高斯拟合:f(x)=a·exp(c(x-d)2)其中,f(x)为高斯拟合函数,a、c、d为参数,x为天气特征变量,S22:将高斯函数的形式转化为矩阵乘法的形式,利用最小二乘法计算出参数a、c、d;S23:对用户历史数据中的每一条签到记录所含的天气特征,定义温度特征T的得分为:定义降雨特征p的得分为:定义风速特征w的得分为:定义用户每条签到记录的天气得分为:Pweather=P(p)·P(w)·P(T)其中,Pweather为天气得分。4.根据权利要求3所述的一种天气特征对用户签到影响的度量方法,其特征在于:步骤S3中所述神经网络为三层结构,包括神经网络依次连接的输入层、隐藏层和输出层,其中所述隐藏层的神经元的数量为12。5.根据权利要求4所述的一种天气特征对用户签到影响的度量方法,其特征在于:步骤S4具体为...

【专利技术属性】
技术研发人员:苏畅吴德正谢显中周秋丽
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1