当前位置: 首页 > 专利查询>北京大学专利>正文

一种面向移动社会网络的用户出行预测方法技术

技术编号:14455579 阅读:104 留言:0更新日期:2017-01-19 04:14
本发明专利技术公布了一种面向移动社会网络的用户出行预测方法,通过计算用户出行的时空熵来确定用户在不同时空场景下出行的不确定性,再根据时空熵建立预测模型对用户出行行为进行预测,包括步骤:进行数据预处理;计算得到用户出行的时空熵;根据设定的时空熵阈值和计算得到的时空熵,建立预测模型进行预测;采用个人预测模型时进行支持度计算;若存在社交关系则建立基于社交关系的出行预测模型;若不存在社交关系则采用动态贝叶斯网络模型。本发明专利技术技术方案能够区分用户在不同时空位置的可预测性,且考虑不同社会关系对用户出行的影响;从而使得预测准确性高,预测效果更佳。

【技术实现步骤摘要】

本专利技术属于计算机数据处理
,涉及移动社会网络中的信息挖掘方法,尤其涉及一种面向移动社会网络数据基于时空熵的移动用户出行预测方法。
技术介绍
随着手机和无线通讯网络的普及,基于位置的移动社会网络数据挖掘研究与应用成为全球学术界和产业界关注的焦点,相应项目包括实时监测人群密度动态分布、利用移动通话数据得到静态城市人群时空分布、家庭定位服务、团队位置跟踪服务以及个人用户定位和导航服务等等。基于位置的信息服务的关键问题之一就是对移动用户的位置进行预测。目前,用户出行预测方法主要基于无线网络和GPS,这两种定位方式都能准确实时地反映目标的位置移动。但是,他们都面临这一个共同的瓶颈问题——定位数据量稀少。随着无线通讯技术的发展,手机成为了人们社会生活的重要工具,每一次通话就是一次定位,虽然通话次数不如GPS定位频繁,但是数据量巨大,因此由通话数据形成的用户离散轨迹为位置预测研究打开了新的视角。位置预测方法主要分为个人预测模型、群体预测模型和混合预测模型。个人预测模型就是通过挖掘个人历史信息中的规律性对个人轨迹进行预测,如现有的基于人类活动周期性建立的模型等;群体轨迹预测模型就是通过挖掘群体历史信息中的规律性来对个人轨迹进行预测,如利用动态贝叶斯网络以及隐式马尔科夫模型对群体建模等;混合预测模型则是通过衡量一个用户的可预测性,来决定是采用个体预测模型还是群体预测模型。可预测性在一定程度上反映了用户的移动规律性,越规律的用户可预测性也就越高。对于高可预测性高的用户使用个人预测模型预测;对于可预测性低的用户,使用群体预测模型。归纳而言,现有预测模型在衡量用户出行的规律性和社会关系对用户出行的影响方面,存在的问题包括:(一)用户出行规律性的衡量:用户出行的可预测性决策了是采用个体预测模型还是群体预测模型。但是,任何个体用户其行为模式中都存在规律性和非规律性的部分。例如,周一到周五用户上班的时空轨迹普遍具有较强的规律性,而周六周日休闲娱乐的轨迹可预测性较差。所以,应该根据用户在不同时空位置的可预测性来决定是采用个体预测模型还是群体预测模型;(二)社会关系对用户出行的影响:已有研究表明,用户的社会关系对用户的出行存在潜在的应用。但是,现有的预测方法虽然在预测模型过程中从总体上考虑了社会关系对用户出行的影响,但却并未体现出具体社交对象对用户出行的影响,实际上,对于不同的社会关系,如家人、朋友、同事等,对人出行的影响方式是存在差异的,不应该一概而论。综上所述,现有的用户出行预测方法不能很好的区分用户在不同时空位置的可预测性,并且没有考虑不同社会关系对用户出行的影响;预测结果难以体现用户在不同时空场景下出行的不确定性和社会关系对用户出行的影响,使得预测的准确性不高。
技术实现思路
为了克服上述现有技术的不足,本专利技术提供一种面向移动社会网络的用户出行预测方法,通过计算用户出行的时空熵来表示用户在该时空位置的可预测性,再根据用户在该时空位置的可预测性来选择不同的预测模型并做改进,对用户出行行为进行预测;该预测方法充分考虑了用户在不同时空场景下出行的不确定性和社会关系对用户出行的影响,从而使得预测准确性更高,预测效果更佳。本专利技术的原理是:针对时空熵高,即出行行为可预测性高的用户,通过选用个人预测模型并使用轨迹合并算法得到用户的频繁轨迹模式;针对时空熵低,即可预测性低的用户,则选择社会关系预测模型,首先判断用户通话对象与用户之间是否具有社会关系,然后根据社交关系的不同分别建立动态贝叶斯网络模型和结合通话对象特征的预测模型。进行预测时,具体输入为当前时间t、位置l和预测步长h,以及预测模型;输出为预测得到的基站号,代表预测得到的用户位置。本专利技术提供的技术方案是:一种面向移动社会网络的用户出行预测方法,通过利用历史数据集计算用户出行的时空熵来确定用户在不同时空场景下出行的不确定性,再根据时空熵建立预测模型对用户出行行为进行预测,包括如下步骤:1)进行数据预处理;根据通话数据的特征,将用户通话记录单记作Call:Call={<t1,tower1>,<t2,tower2>,…,<ti,toweri>,…,<tn,towern>本文档来自技高网
...

【技术保护点】
一种面向移动社会网络的用户出行预测方法,通过利用历史数据集计算用户出行的时空熵来确定用户在不同时空场景下出行的不确定性,再根据时空熵建立预测模型对用户出行行为进行预测,包括如下步骤:1)进行数据预处理,对历史数据集进行去冗余化和去基站化;2)利用历史数据集,计算得到用户出行的时空熵;用户在<t,tower>下,当预测步长为h时,时空熵的计算包括如下步骤:步骤一:在历史数据集中,统计用户在时间点t,基站tower下经过时间h后的转移模式,得到以一个五元向量<t,tower,t+h,towerx,count>表示的转移模式,其中towerx为用户在t+h时间点的位置,count表示这样的五元组的出现次数;步骤二:根据式3计算towerx在五元组中的出现频率:P=P{Tower′=towerc|Tower=tower,Time=t}   (式3)式3中,P为条件概率,表示用户在时间t在基站tower的前提下t+h出现在towerx的概率;Tower′为计算出现频率的基站;步骤三:再根据公式4,得到用户在<t,tower>下,预测步长为h时的时空熵;其中C表示五元组集合的大小:Entropy<t,tower>=-Σi=1cpi×log2pi]]>   (式4)式4中,Entropy<t,tower>为用户在<t,tower>下,预测步长为h时的时空熵;pi为式3计算的条件概率,i为五元向量组集合中towerx的其中一个值;c为表示五元组集合的大小;3)根据设定的时空熵阈值和步骤2)中得到的时空熵,建立预测模型对用户出行行为进行预测,得到用户下一时刻的转移位置;若时空熵大于阈值,则建立个人预测模型进行预测;若时空熵小于阈值,则进一步判断是否存在社交关系,若有社交关系,则建立基于社交关系的出行预测模型进行预测;若无社交关系,则通过动态贝叶斯网络模型进行预测。...

【技术特征摘要】
1.一种面向移动社会网络的用户出行预测方法,通过利用历史数据集计算用户出行的时空熵来确定用户在不同时空场景下出行的不确定性,再根据时空熵建立预测模型对用户出行行为进行预测,包括如下步骤:1)进行数据预处理,对历史数据集进行去冗余化和去基站化;2)利用历史数据集,计算得到用户出行的时空熵;用户在<t,tower>下,当预测步长为h时,时空熵的计算包括如下步骤:步骤一:...

【专利技术属性】
技术研发人员:宋国杰王韵
申请(专利权)人:北京大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1