当前位置: 首页 > 专利查询>武汉大学专利>正文

一种手机用户上网时段预测方法技术

技术编号:15260211 阅读:55 留言:0更新日期:2017-05-03 12:59
本发明专利技术公开了一种手机用户上网时段预测方法,其中周期性计算方法,是将固定时间间隔的用户上网状态的时间序列数据看作离散的信号,利用傅里叶来分析用户上网状态序列的周期性;其中差异性计算方法,是利用手机上网数据,通过探究手机用户群体上网对不同时间段的偏好,对一天24个时段的人数进行层次聚类,得到三个上网时间期,即高频时期、低频时期和过渡时期。其中预测方法,是基于前面的特征提出双向Markov混合模型、Lift‑Markov混合模型两种混合Markov预测模型,从不同角度对用户的上网时段进行预测,并在概率框架下结合起来。本发明专利技术数据获取方式简单、成本低,模型结构简单,准确率高。

A method for predicting the time of Internet access for mobile phone users

The invention discloses a mobile phone user access time prediction method, the periodic calculation method, the fixed interval time series data of Internet users as discrete signal, periodic analysis of Internet users state sequence by Fourier transform; the difference calculation method is the use of mobile phone Internet data through mobile phone inquiry the Internet user groups in different period of time preference, the number of 24 hours a day for hierarchical clustering, three time period, that is, low frequency and high frequency period during the transition period. The prediction method is a two-way mixed model, Markov, Lift Markov two hybrid model mixed Markov prediction model proposed in front of the characteristics from different angles based on the prediction of surfing time for users, and combined in a probabilistic framework. The invention has the advantages of simple data acquisition mode, low cost, simple structure and high accuracy.

【技术实现步骤摘要】

本专利技术属于手机上网预测
,涉及一种手机上网行为预测方法,具体涉及一种混合Markov预测方法对手机用户上网行为周期性与差异性计算和上网时段预测的方法。技术背景目前,在手机上网预测方面的技术相对较少,一种方法是对有线上网时间的分布和偏好进行统计和预测,但是当前社会,手机上网以及成为用户接入网络空间的主要方式之一,而有线上网与手机上网的时间分布以及偏好存在着非常大啊的差异,因而该方法不能完全适用于手机上网的预测。第二种方法是直接对WAP访问和网页访问进行建模预测,但该方法缺少对手机用户上网规律的挖掘与分析,以及用户在网络空间的行为充分挖掘,所以准确率不高。上述两种方法都难以对手机用户上网时段的建模与预测手段。
技术实现思路
为了解决现有手机用户上网行为难以预测的问题,本专利技术提出一种混合Markov预测方法对用户上网行为进行预测的方法。本专利技术所采用的技术方案是:一种手机用户上网时段预测方法,通过基于周期性和差异性预测手机用户上网时间段;其特征在于:所述周期性的计算方法,是将固定时间间隔的用户上网状态的时间序列数据看作离散的信号,利用傅里叶来分析用户上网状态序列的周期性;所述差异性的计算方法,是利用手机上网数据,通过探究手机用户群体上网对不同时间段的偏好,根据对不同时段人数的层次聚类将一天24个时段划分为三个上网时期,即高频时期、低频时期和过渡时期。作为优选,所述基于手机用户群体上网的周期性和差异性对不同时期内的上网时段进行预测,其具体实现包括以下步骤:步骤1:利用手机用户上网数据,将固定时间间隔的用户上网状态的时间序列数据看作离散的信号,利用傅里叶来分析用户上网状态序列的周期性;根据对不同时段人数的层次聚类将一天24个时段划分为三个上网时期,得到其差异性步骤2:利用手机用户上网数据,根据其周期性和差异性计算三个不同时期内相邻两个时间段间,用户在三个时期是上网状态的转移概率矩阵,并根据当前时段上网状态,确定用户的状态分布;步骤3:利用手机用户上网的计算三个不同时期内相邻两天,同一时间段间,用户在三个时期是上网状态的转移概率矩阵,并根据该时刻前一天上网状态,确定用户的状态分布;步骤4:对步骤A2和步骤A3的结果进行加权平均,得到用户在目标时间段内上网的概率。本专利技术具有如下优点:数据获取方式简单、成本低,模型结构简单,准确率高。附图说明附图1为本专利技术实施例的用户手机上网行为的时间特征存在周期性和差异性示意图。附图2为本专利技术实施例中按照历史上网序列以及同一时段前后两天的状态转移对目标时段的上网行为进行预测示意图。附图3为本专利技术实施例中LM模型与其他模型在准确率以及性能提升方面的比较图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。在实际生活中,用户使用手机发生上网行为时间特征是具有周期性和差异性的。如附图1(a)所示,同一天不同时段手机用户群体的上网人数存在较大的差异;用户群体的上网时间存在明显的以天为周期的周期性特征,偶有异常;虽然不同日期的同一时段上网人数存在一定的差异,但是每一天整体波动趋势几乎一样,都表现出双波峰的形态,即在12和18时间段出现上网人数高峰。说明用户使用手机发生上网行为是具有周期性的。如附图1(b)所示,对一天24个时段的上网用户进行层次聚类,结果将24个时间段分为三大类,低频活动期,这一段时间用户大多处于晚上休息的状态手机上网用户较少;高频活动期,该时间段为手机上网用户较多的一类,用户大多处于工作或活动的状态;过渡时期时,也就是说用户群体从低频活动期过渡到高频活动期或由高频活动期过渡到低频活动期。尽管每一类中,各个时段的活跃程度存在一定的差异(比如:在高频活动期内也存在用户数较少的时间段),但是手机用户群体相似的上网时段确实存在。手机用户上网时段预测的基本思路是:如图2所示,从纵横两个角度挖掘用户上网行为规律,不仅仅考虑了当前t时段的状态对t+1时段的影响,还考虑了用户前一天在t+1时段的状态对当前t+1时段的状态影响。这里假定手机用户每天上网状态的变化过程是一个马尔科夫过程,对于用户Ui,当用户在t时段所处的状态为已知时,过程在时段tn(tn>t)处的状态,只与过程在t时段所处的状态有关,而与过程在t时段之前所处的状态无关。这里根据对时段聚类的结果将一天划分为三个时期,并根据个体用户的周期性从历史数据中得到每个时期t时段到t+1时段状态转移概率矩阵。同时,本专利技术通过关联规则和马尔科夫链挖掘用户前后两天相同时段上网状态的关联关系或用户同一时段的上网规律。为了尽可能提升预测的准确性,本专利技术采用纵横双向Markov混合模型(DM模型),所谓纵横双向是指同时考虑基于用户的历史上网状态序列计算得到用户在低频、高频和过渡时期三个状态转移概率矩阵,以及同一时段前后两天的状态转移概率矩阵,并在概率框架下结合双向的两种预测的状态概率,得到最后的预测状态。这种预测方法具有以下特点:(1)根据Markov相关理论,考虑手机用户上一时间段的状态对于当前上网行为的影响;(2)根据关联规则,考虑了同一时间段前一天的手机用户上网行为对于当天该时段用户上网行为的影响。以下通过具体实施例对本专利技术做进一步的阐述;(1)以湖北省某城市2015年8月10号到2015年8月29号,共12.3万人的手机4G流量收费数据。数据记录了用户的上网信息,包括该上网的时间,地点(手机基站)流量等。其中,共有46494人的记录通过了以天为周期检验,这里对通过检验的人的记录根据是否有上网状态进行过滤,选取出每天都有手机上网状态记录的用户的共2101人的记录数据作为本专利技术实验的数据集。将前10天的数据划分为训练集,后10天的数据划分为测试集,每测试一天将一天的测试数据加入到训练数据进行下一天的测试实验。(2)本实施例采用两种方法对手机用户上网行为周期性与差异性进行预测,具体得到预测结果的过程如下所示:方法一.双向Markov混合模型步骤1、构建用户Ui的上网状态序列。按照一定的时间间隔,生成用户每天的上网状态序列,共得到n天的序列,用E来表示他们的集合。步骤2、计算三个不同时期内t时段到t+1时段用户Ui的三个状态转移概率矩阵Pt,并根据t时段上网状态,确定状态分布St。假设用户的状态集为S={i,j…本文档来自技高网...

【技术保护点】
一种手机用户上网时段预测方法,通过基于周期性和差异性预测手机用户上网时间段;其特征在于:所述周期性的计算方法,是将固定时间间隔的用户上网状态的时间序列数据看作离散的信号,利用傅里叶来分析用户上网状态序列的周期性;所述差异性的计算方法,是利用手机上网数据,通过探究手机用户群体上网对不同时间段的偏好,根据对不同时段人数的层次聚类将一天24个时段划分为三个上网时期,即高频时期、低频时期和过渡时期。

【技术特征摘要】
1.一种手机用户上网时段预测方法,通过基于周期性和差异性预测手机用户上网时间段;其特征在于:所述周期性的计算方法,是将固定时间间隔的用户上网状态的时间序列数据看作离散的信号,利用傅里叶来分析用户上网状态序列的周期性;所述差异性的计算方法,是利用手机上网数据,通过探究手机用户群体上网对不同时间段的偏好,根据对不同时段人数的层次聚类将一天24个时段划分为三个上网时期,即高频时期、低频时期和过渡时期。2.根据权利要求1所述的手机用户上网时段预测方法,其特征在于,...

【专利技术属性】
技术研发人员:方志祥于冲张韬冯明翔
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1