一种基于社交网络的位置预测系统及方法技术方案

技术编号:16270124 阅读:33 留言:0更新日期:2017-09-22 21:47
本发明专利技术属于社交网络位置预测技术领域,公开了一种基于社交网络的位置预测系统及方法,包括:爬取社交网络签到数据;对爬取的社交网络签到数据进行预处理,清洗掉无效的数据,利用核平滑插值技术对签到数据的稀疏性进行处理;结合常规位置预测的输出概率和非常规位置预测的输出概率,预测下一位置是否为常规位置:通过常规位置预测得到top‑m个位置列表;通过提取分析数据中采集的非结构化信息,应用于top‑m位置列表,得到top‑k个位置列表。通过知识图谱和位置推荐系统对非常规位置预测。本发明专利技术解决了位置预测中冷启动问题、非常规位置预测问题;提高了预测精度。

【技术实现步骤摘要】
一种基于社交网络的位置预测系统及方法
本专利技术属于社交网络位置预测
,尤其涉及一种基于社交网络的位置预测系统及方法。
技术介绍
随着互联网的快速发展和可定位设备的大量普及,基于地理位置服务的网络应用越来越普及,如定向广告(targetedadvertisement)、跟踪人口流动、预防疾病蔓延、网络安全、性能优化等,地址位置作为一种质量极高的信息资源被广泛应用。同时伴随着在线社交网络的发展,位置服务和在线社交网络逐渐趋于融合,即产生了LBSN。基于位置的LBSN是位置和社交的结合体,它支持用户随时随地在社交平台记录并分享自己的地理信息,它是以通信网络为媒介,以智能终端为主要载体的新型平台。在LBSN中,大量用户通过签到向朋友分享位置信息或地理标签。位置社交网络让基于位置的社交成为一种新的社交模式,使得线上社交和线下社交得到有机的结合,极大的改变了人们的生活方式。社交网络催生了许多基于位置的服务,为了提供更好的服务,预测用户最有可能的下一个位置是非常重要的。如通过预测用户下一个位置,商家可以更加有效的投放定向广告。现有预测方法有基于GPS轨迹历史数据的位置预测,有基于社交网络签到数据的位置预测。社交网络签到数据和GPS轨迹历史数据有着明显的区别。社交网络签到历史数据较稀疏,位置预测范围较大。相比于社交网络签到数据,连续记录的GPS数据之间间隔5-10米。但是GPS数据仅仅包括经度、纬度和时间戳信息,没有包括语义信息,无法根据社交关系进行位置预测。现有的基于社交网络的位置预测主要有运动轨迹的预测和下一地点的预测。运动轨迹的预测相对复杂,开销较大,对周期性轨迹预测表现良好,但是对周期性不明显的轨迹预测精度较差。现有基于社交网络下一位置预测假设下一位置用户曾经访问过,下一位置仅仅从个人历史位置中选择,容易造成“冷启动”,导致常规位置预测良好,非常规位置预测精度较低。综上所述,现有技术存在的问题是:现有基于GPS历史数据位置预测不包含语义信息,无法根据社交关系进行位置预测。现有的基于社交网络轨迹相似性位置预测存在运动轨迹预测相对复杂,开销较大,对周期性不明显的轨迹预测精度较差,容易造成“冷启动”。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种基于社交网络的位置预测系统及方法。本专利技术是这样实现的,一种基于社交网络的位置预测方法,所述基于社交网络的位置预测方法包括以下步骤:步骤一,爬取社交网络签到数据;步骤二,对爬取的社交网络签到数据进行预处理,过滤掉签到次数小于平均签到次数的数据,清洗掉无效的数据,利用核平滑插值技术对签到数据的稀疏性进行处理;在f(x)中,若使用邻域样本的均值进行插值,则使f(x)不平滑,所以使用一个核函数对估计值平滑;具体使用核加权平均,公式为:其中K(.)采用高斯核函数,可见,离x0越近的影响力越大,对应输出的权越大,符合签到数据的实际模拟;步骤三,结合常规位置预测的输出概率Pr(loc)和非常规位置预测的输出概率Pu(loc),预测下一位置是否为常规位置;步骤四,通过常规位置预测模块,得到top-m个位置列表;通过提取分析数据采集模块中采集的非结构化信息,应用于top-m位置列表,提高位置预测精度,得到top-k个位置列表,k<=m。进一步,所述预测下一位置是否为常规位置公式为:P(loc)=λPr(loc)+(1-λ)Pu(loc)。其中Pr(loc)为常规位置预测概率,Pu(loc)为非常规位置预测概率,λ为调节参数,λ∈{0,1}。进一步,所述常规位置预测采用MHMM算法,HMM结合时间特征和空间特征对位置进行预测。不考虑时间和空间的影响,给定相同的观测序列,HMM总是得到相同的预测结果;考虑到社交用户的签到行为受到时间和空间的影响,选用混合HMM算法对下一位置进行预测。其中Ct+1为t+1时刻的位置类别,St为t时刻的观察序列状态,为时间空间向量。进一步,所述非常规位置预测结合构建知识图谱,挖掘社交关系,采用融合社交关系的马尔科夫模型结合位置推荐系统对非常规位置进行预测。利用签到数据集构建知识图谱,在知识图谱上进行推理,挖掘相似用户,基于历史签到数据并融合相似用户训练一个马尔科夫模型对下一位置进行预测。最后将马尔科夫模型和位置推荐系统结合在一起,提高位置预测精度。进一步,利用签到数据集作为数据来源,构建社交知识图谱,在知识图谱上进行推理。推理方法有三类:Embedding-based技术,Pathrankingalgorithms,和Probabilisticgraphicalmodels概率模型。社交关系的推理采用Embedding-based技术。Embedding-based技术是以隐式因子模型为基本思想的方法,它是基于低维向量的表示方法,将知识图谱中的实体和关系在低维的向量空间里进行表达,然后进行推理。首先将实体和关系进行向量表示;其次,定义打分函数来衡量关系成立的可能性。再者,参数估计,根据打分函数推理相似用户。相似用户推理综合打分函数结构化信息和非结构化分析模块提取的兴趣相似度,表示如下:sim(u,v)=αs(u,v)+(1-α)w(u,v);其中,α是调节参数,取值为[0,1],反应结构化信息和非结构化信息相似度所占比重,s(u,v)代表结构化信息相似度,w(u,v)代表非结构信息相似度。非结构化信息相似度是非结构信息分析模块提取兴趣关键字,然后根据余弦相似度计算用户之间的相似度。计算如下:其中ui,uj表示用户i和用户j兴趣关键字向量表示。余弦值取值范围为[0,1],0表示完全不同,1表示完全相同。在历史签到数据的基础上,融合相似用户的影响,训练马尔科夫模型对位置进行预测,即Lm=maxP(Am|H,sim(u,v)),其中Am代表马尔科夫算法,H代表历史签到数据,sim(u,v)代表用户相似度。最后,综合融合相似用户的马尔科夫模型和位置推荐系统,提高位置预测精度。其公式如下:Ltop-n=βLm+(1-β)Sr;其中Lm代表融合相似用户的马尔科夫模型,Sr代表位置推荐系统,β为调节权重,取0.6。综合融合相似用户的马尔科夫模型和位置推荐系统,得到top-n位置列表。本专利技术的另一目的在于提供一种所述基于社交网络的位置预测方法的基于社交网络的位置预测系统包括:数据采集模块,应用爬虫系统,爬取社交网络签到数据;数据预处理模块,对爬取的社交网络签到数据进行预处理,清洗掉无效的数据,利用核平滑插值技术对签到数据的稀疏性进行处理;判断模块,结合常规位置预测的输出概率Pr(loc)和非常规位置预测的输出概率Pu(loc),预测下一位置是否为常规位置;常规位置预测模块,用于对预测位置进行分类,先预测位置的类别,预测位置;非结构化数据分析模块,通过常规位置预测模块,得到top-m个位置列表;通过提取分析数据采集模块中采集的非结构化信息,应用于top-m位置列表,提高位置预测精度,得到top-k个位置列表;非常规位置预测模块,结合构建知识图谱,挖掘相似用户,采用融合相似用户的马尔科夫模型结合位置推荐系统对非常规位置进行预测。本专利技术的另一目的在于提供一种应用所述基于社交网络的位置预测方法的社交网络终端。本专利技术的优点及积极效果为:基于社交网络签到数据,结合本文档来自技高网
...
一种基于社交网络的位置预测系统及方法

【技术保护点】
一种基于社交网络的位置预测方法,其特征在于,所述基于社交网络的位置预测方法包括以下步骤:步骤一,爬取社交网络签到数据;步骤二,对爬取的社交网络签到数据进行预处理,过滤掉签到次数小于平均签到次数的数据,清洗掉无效的数据,利用核平滑插值技术对签到数据的稀疏性进行处理;在f(x)中,若使用邻域样本的均值进行插值,则使f(x)不平滑,所以使用一个核函数对估计值平滑;具体使用核加权平均,公式为:

【技术特征摘要】
1.一种基于社交网络的位置预测方法,其特征在于,所述基于社交网络的位置预测方法包括以下步骤:步骤一,爬取社交网络签到数据;步骤二,对爬取的社交网络签到数据进行预处理,过滤掉签到次数小于平均签到次数的数据,清洗掉无效的数据,利用核平滑插值技术对签到数据的稀疏性进行处理;在f(x)中,若使用邻域样本的均值进行插值,则使f(x)不平滑,所以使用一个核函数对估计值平滑;具体使用核加权平均,公式为:其中K(.)采用高斯核函数,可见,离x0越近的影响力越大,对应输出的权越大,符合签到数据的实际模拟;步骤三,结合常规位置预测的输出概率Pr(loc)和非常规位置预测的输出概率Pu(loc),预测下一位置是否为常规位置;步骤四,通过常规位置预测模块,得到top-m个位置列表;通过提取分析数据采集模块中采集的非结构化信息,应用于top-m位置列表,提高位置预测精度,得到top-k个位置列表,k<=m。2.如权利要求1所述的基于社交网络的位置预测方法,其特征在于,所述预测下一位置是否为常规位置公式为:P(loc)=λPr(loc)+(1-λ)Pu(loc);其中Pr(loc)为常规位置预测概率,Pu(loc)为非常规位置预测概率,λ为调节参数,λ∈{0,1}。3.如权利要求1所述的基于社交网络的位置预测方法,其特征在于,所述常规位置预测采用MHMM算法,HMM结合时间特征和空间特征对位置进行预测;选用混合HMM算法对下一位置进行预测;其中Ct+1为t+1时刻的位置类别,St为t时刻的观察序列状态,为时间空间向量。4.如权利要求1所述的基于社交网络的位置预测方法,其特征在于,所述非常规位置预测结合构建知识图谱,挖掘社交关系,采用融合社交关系的马尔科夫模型结合位置推荐系统对非常规位置进行预测;首先利用签到数据集构建知识图谱,在知识图谱上进行推理,其次基于历史签到数据并融合相似用户训练一个马尔科夫模型对下一位置进行预测;最后将马尔科夫模型和位置推荐系统结合在一起,提高位置预测精度。5.如权利要求4所述的基于社交网络的位置预测方法,其特征在于,所述非常规位置预测结合构建知识图谱,挖掘社交关系,采用融合社交关系的马尔科夫模型结合位置推荐系统对非常规位置进行预测;具体包括:用签到数据集作为数据来源,构建社交知识图谱,在知识图谱上进行推理;推理方法包括三类:Embedding-based技术,Pathrankingalgorithms和Probabilisticgraphicalmodels概率模型;社交关系的推理采用...

【专利技术属性】
技术研发人员:尚凤军刘海昇
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1