当前位置: 首页 > 专利查询>南开大学专利>正文

一种根据手机上网日志预测手机信号强度的方法技术

技术编号:16532181 阅读:127 留言:0更新日期:2017-11-10 01:11
本发明专利技术提供了一种根据手机上网日志(httplog数据)预测手机信号强度的方法,其步骤为:根据httplog数据中的IMSI和时间字段,在MME数据中找到对应的用户三元组,通过用户三元组可以在MR数据中提取对应的信号强度数据,将信号强度数据与httplog数据结合成为训练数据,进行数据统计、特征抽取、模型构建、模型训练,最后使用训练好的模型进行预测,根据httplog数据预测手机信号强度。

A method for predicting the strength of mobile phone signals based on mobile phone logs

The present invention provides a log on the Internet according to the mobile phone (httplog) mobile phone signal strength prediction method, which comprises the following steps: according to the IMSI and httplog time field data, find the corresponding user three tuples in the MME data, can be extracted from the signal strength data corresponding to the user in the MR data through the three tuple, the signal the intensity data and httplog data are combined into the training data, statistical data, feature extraction, model construction, model training, and finally use the trained model to predict the signal strength of mobile phone prediction based on httplog data.

【技术实现步骤摘要】
一种根据手机上网日志预测手机信号强度的方法
本专利技术属于信息
具体涉及一种根据手机上网日志预测手机信号强度的方法。
技术介绍
随着移动互联网的发展,越来越多的人选择使用手机上网,对于移动运营商来说,通过对大量上网日志的统计和分析,掌握用户的上网情况,可以推测用户的访问行为喜好,进而进行精准的广告投放与营销。也可以结合用户行为和基站情况,进行网络优化,提高用户体验。在网络优化过程中,用户手机的信号强度是极为重要的数据,但其只存储在MR数据中。MR数据是指信息在业务信道上每480ms(信令信道上470ms)发送一次数据,也就是说任何处于开机状态的手机每480ms向基站发送一次数据,因此每天会产生大量MR数据,其存储代价很大,运营商很难把MR数据全部存储下来进行统计和分析。现有技术只能通过MR数据获得信号强度,没有其他技术来测定手机信号强度,因此通过手机上网日志数据来预测手机信号强度显得尤为重要,既可以节约存储成本,又可以将MR数据与上网日志数据相结合进行网络优化。
技术实现思路
本专利技术的目的是提供一种基于手机上网日志数据的手机信号强度预测方法,通过该方法预测当前用户手机的信号强度。本专利技术提供的根据手机上网日志预测手机信号强度的方法,详细步骤包括:第1、获取当前周期所有手机的httplog数据,提取IMSI和时间字段;定义1:httplog数据;httplog数据是指用户使用移动网络时,基站所保存的日志数据。该数据所包含的信息有:(1)用户信息:主要包括用户手机的基本信息,如手机号码、手机串号、所使用的浏览器、下载及上传的数据流量大小等。(2)基站信息:主要包括用户所连接基站的基本信息,如基站经纬度、基站所在的行政区域、基站ID等。(3)行为信息:指用户的具体上网行为,如访问的网址、使用的应用类型、http传输字段类型等。(4)时间信息:指用户发生上网行为时,与时间有关的信息,如:上网行为的开始时间和结束时间、TCP建链响应时间、业务时延等。定义2:IMSI字段;IMSI字段是指国际移动用户识别码(InternationalMobileSubscriberIdentificationNumber),是区别移动用户的标志,储存在SIM卡中,是用于区别移动用户的有效信息。IMSI字段总长度不超过15位,同样使用0~9的数字。对httplog数据的IMSI和时间字段进行抽取,因为这两个字段属于httplog数据的基本字段,若有任意字段为空,则认为该条数据不完整,舍弃该条数据。第2、找到httplog数据对应的用户三元组;第2.1、获取手机MME数据,提取IMSI、时间和用户三元组字段;定义3:MME数据;MME(MobilityManagementEntity)数据是3GPP协议LTE接入网络的关键控制节点,它负责空闲模式的UE(UserEquipment)的定位,传呼过程,包括中继,简单的说MME是负责信令处理部分。MME数据中有IMSI、时间以及用户三元组字段,可以建立三者的对应关系。定义4:用户三元组;用户三元组包括MmeUeS1apId、MmeGroupId和MmeCode,该三元组是根据IMSI分配的三元组,作为用户唯一标识符,同一个IMSI在一段时间内,分配的用户三元组是不变的,所以可以根据IMSI和时间字段找到对应的用户三元组。第2.2、获取IMSI-时间元组与用户三元组的对应关系。将IMSI和时间字段作为一个元组,称为IMSI-时间元组,使用该元组作为key值,用户三元组字段作为value值,即可建立IMSI-时间元组(IMSI、时间)与用户三元组的对应关系字典。此时如果存在IMSI、时间或用户三元组任意字段为空的情况,则需要舍弃该对应关系。第2.3、通过httplog数据的IMSI和时间字段,在第2.2步所建立的对应关系字典中查询,获取对应的用户三元组。具体步骤为将httplog数据的IMSI和时间字段组成(IMSI、时间)元组,以该元组为key值,在第2.2步建立的对应关系字典中查询其value值,查询成功即获取对应的用户三元组。第3、获取httplog数据所对应的信号强度数据;第3.1、获取手机MR数据,提取信号强度和用户三元组字段;定义5:MR数据;MR(MeasurementReport,测量报告)数据是指信息在业务信道上每480ms(信令信道上470ms)发送一次数据,这些数据可用于网络评估和优化。该数据最重要的字段是信号强度,可以表示当前用户手机在当前时刻的信号强度的大小。MR数据是以xml格式进行存储的,需要对其进行解析,解析之后可以提取信号强度和用户三元组字段。第3.2、根据httplog数据的用户三元组字段,在MR数据中提取对应的信号强度数据。通过在第2.3步所查询到的用户三元组字段,能够在MR数据提取对应的信号强度数据。第4、将信号强度数据与httplog数据相结合,形成训练数据;训练数据的label为信号强度数据,特征为httplog数据其他字段所提取出的特征。第5、使用训练数据训练模型;训练模型时要经过数据统计、特征抽取、模型构建和模型训练等步骤。数据统计,包括字段类型统计、数据稀疏程度统计和缺失值统计,同时也会进行数据清洗和数据转换等步骤。特征抽取步骤,是指多维度多层次地进行特征抽取,通过数据统计发现数据中的规律,挖掘有价值的特征,除了容易抽取的基本特征外,重点从时空特征以及内容特征方面着手。模型构建步骤,需要根据输入特征选择合适的模型进行训练,由于数据比较稀疏,因此采用GBDT(GradientBoostingDecisionTree)模型。该模型运用集成学习的思想,以决策树作为基本分类器,能够很好地学习非线性函数关系。模型训练,指使用训练数据对模型进行训练,同时进行参数调优。第6、利用训练好的模型进行预测;获取测试用httplog数据后,经过与第5步相同的数据统计、特征抽取步骤,形成测试数据作为模型的输入,模型的输出结果即为预测结果。预测时其数据统计和特征抽取方法与训练时类似,但随着时间变化,其模型需要不断更新,需要不断训练新模型进行预测。本专利技术的优点和有益效果:本专利技术提出了一种根据手机上网日志预测手机信号强度的方法,该方法可以利用存储代价小的httplog数据预测存储代价巨大的信号强度数据,节约存储成本,同时便于运营商进行网络优化。目前运营商只能存储小部分信号强度数据,因此很少利用该数据进行研究。应用该专利技术后运营商可以根据上网日志预测出大量信号强度数据,可在用户行为分析、广告投放等方面进行更深层的研究。附图说明图1是根据手机上网日志数据预测手机信号强度方法的流程图。具体实施方式以下结合实施实例来具体说明本专利技术。第1步、获取当前周期所有手机的httplog数据,提取其IMSI和时间字段httplog数据是指用户使用移动网络时,基站所保存的日志数据。该数据所包含的信息有用户信息、基站信息、行为信息、时间信息。其中用户信息中有IMSI字段,是区别移动用户的标志,储存在SIM卡中,是用于区别移动用户的有效信息。对httplog数据的IMSI和时间字段进行抽取,因为这两个字段属于httplog数据的基本字段,若有任意一字段为空,则认为该条数据不完整,舍弃该条本文档来自技高网...
一种根据手机上网日志预测手机信号强度的方法

【技术保护点】
一种根据手机上网日志预测手机信号强度的方法,其步骤为:第1、获取当前周期所有手机的httplog数据,提取IMSI和时间字段;定义1:httplog数据;定义如下:httplog数据是指用户使用移动网络时,基站所保存的日志数据;该数据所包含的信息主要有:(1)用户信息:主要包括用户手机的基本信息;(2)基站信息:主要包括用户所连接基站的基本信息;(3)行为信息:指用户的具体上网行为;(4)时间信息:指用户发生上网行为时,与时间有关的信息;定义2:IMSI字段;定义如下:IMSI字段是指国际移动用户识别码(International Mobile Subscriber Identification Number),是区别移动用户的标志,储存在SIM卡中,是用于区别移动用户的有效信息;IMSI字段总长度不超过15位,同样使用0~9的数字;第2、找到httplog数据对应的用户三元组;第2.1、获取手机MME数据,提取IMSI、时间和用户三元组字段;定义3:MME数据;定义如下:MME(Mobility Management Entity)是3GPP协议LTE接入网络的关键控制节点,它负责空闲模式的UE(User Equipment)的定位,传呼过程,包括中继,简单的说MME是负责信令处理部分;MME数据中有IMSI、时间以及用户三元组字段,能够建立三者的对应关系;定义4:用户三元组;定义如下:用户三元组包括MmeUeS1apId、MmeGroupId和MmeCode,该三元组是根据IMSI分配的三元组,作为用户唯一标识符,同一个IMSI在一段时间内,分配的用户三元组是不变的,所以能够根据IMSI和时间字段找到对应的用户三元组;第2.2、获取IMSI‑时间元组与用户三元组的对应关系;将IMSI和时间字段作为一个元组,称为IMSI‑时间元组,使用该元组作为key值,用户三元组字段作为value值,即可建立IMSI‑时间元组(IMSI、时间)与用户三元组的对应关系字典;第2.3、通过httplog数据的IMSI和时间字段,在第2.2步所建立的对应关系字典中查询,获取对应的用户三元组;第3、获取httplog数据所对应的信号强度数据;第3.1、获取手机MR数据,提取信号强度和用户三元组字段;定义5:MR数据;定义如下:MR(Measurement Report,测量报告)数据是指信息在业务信道上每480ms或信令信道上470ms发送一次数据,这些数据能够用于网络评估和优化;该数据最重要的字段是信号强度,能够表示当前用户手机在当前时刻的信号强度的大小;MR数据是以xml格式进行存储的,需要进行解析,解析之后能够提取信号强度和用户三元组字段;第3.2、根据httplog数据的用户三元组字段,在MR数据中提取对应的信号强度数据;通过在第2.3步所查询到的用户三元组字段,能够在MR数据中提取对应的信号强度数据;第4、将信号强度数据与httplog数据相结合,形成训练数据;第5、使用训练数据训练模型;第6、利用训练好的模型进行预测。...

【技术特征摘要】
1.一种根据手机上网日志预测手机信号强度的方法,其步骤为:第1、获取当前周期所有手机的httplog数据,提取IMSI和时间字段;定义1:httplog数据;定义如下:httplog数据是指用户使用移动网络时,基站所保存的日志数据;该数据所包含的信息主要有:(1)用户信息:主要包括用户手机的基本信息;(2)基站信息:主要包括用户所连接基站的基本信息;(3)行为信息:指用户的具体上网行为;(4)时间信息:指用户发生上网行为时,与时间有关的信息;定义2:IMSI字段;定义如下:IMSI字段是指国际移动用户识别码(InternationalMobileSubscriberIdentificationNumber),是区别移动用户的标志,储存在SIM卡中,是用于区别移动用户的有效信息;IMSI字段总长度不超过15位,同样使用0~9的数字;第2、找到httplog数据对应的用户三元组;第2.1、获取手机MME数据,提取IMSI、时间和用户三元组字段;定义3:MME数据;定义如下:MME(MobilityManagementEntity)是3GPP协议LTE接入网络的关键控制节点,它负责空闲模式的UE(UserEquipment)的定位,传呼过程,包括中继,简单的说MME是负责信令处理部分;MME数据中有IMSI、时间以及用户三元组字段,能够建立三者的对应关系;定义4:用户三元组;定义如下:用户三元组包括MmeUeS1apId、MmeGroupId和MmeCode,该三元组是根据IMSI分配的三元组,作为用户唯一标识符,同一个IMSI在一段时间内,分配的用户三元组是不变的,所以能够根据IMSI和时间字段找到对应的用户三元组;第2.2、获取IMSI-时间元组与用户三元组的对应关系;将IMSI和时间字段作为一个元组,称为IMSI-时间元组,使用该元组作为key值,用户三元组字段作为value值,即可建立IMSI-时间元组(IMSI、时间)与用户三元组的对应关系字典;第2.3、通过httpl...

【专利技术属性】
技术研发人员:陈晨肖佳坤詹义袁晓洁
申请(专利权)人:南开大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1