流量数据的定位方法及装置、存储介质、服务器制造方法及图纸

技术编号:21146410 阅读:20 留言:0更新日期:2019-05-18 06:49
一种流量数据的定位方法及装置、存储介质、服务器,所述定位方法包括:从一组流量数据中提取多个信息对,每一信息对包括IP地址及其关联的地理位置信息;对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置;接收待定位的流量数据,根据所述待定位的流量数据的IP地址以及确定的所述IP地址的中心地理位置,得到所述待定位的流量数据的地理位置信息。通过本发明专利技术实施例提供的技术方案,可以得到各个流量数据的位置信息,且定位精度更高。

Location Method and Device, Storage Media and Server of Flow Data

【技术实现步骤摘要】
流量数据的定位方法及装置、存储介质、服务器
本专利技术涉及大数据
,具体地涉及一种流量数据的定位方法及装置、存储介质、服务器。
技术介绍
随着移动设备的广泛使用以及商业数据管理平台(DataManagementPlatform,简称DMP)步入大数据时代,移动用户的地理位置信息已成为数据挖掘与分析的重要数据来源。在移动互联网的效果广告投放中,往往基于移动用户的地理位置信息进行广告投放。但是,在实际应用中,由于建筑物遮挡、软件错误等原因,可能造成移动用户的流量数据存在问题。例如,流量数据缺失经纬度信息或者经纬度信息不正确。此时,需求方平台(Demand-SidePlatform,简称DSP)获取的流量数据将缺少位置相关信息。即使存在经纬度信息,但其精度也很低,可能难以满足DSP期望得到的位置相关信息。
技术实现思路
本专利技术解决的技术问题是如何定位流量数据的位置信息,且准确度更高。为解决上述技术问题,本专利技术实施例提供一种流量数据的定位方法,包括:从一组流量数据中提取多个信息对,每一信息对包括IP地址及其关联的地理位置信息;对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置;接收待定位的流量数据,根据所述待定位的流量数据的IP地址以及确定的所述IP地址的中心地理位置,得到所述待定位的流量数据的地理位置信息。可选的,对所述多个信息对进行统计之前,所述方法还包括:根据IP地址与地理位置的预设匹配关系,对所述多个信息对进行过滤,以剔除IP地址与其关联的地理位置信息不匹配的信息对。可选的,所述对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置包括:根据IP地址划分所述多个信息对,将具有相同IP地址的信息对划分为同一信息簇;针对每一信息簇中的IP地址,对所述IP地址关联的地理位置信息进行统计,以得到所述IP地址对应的IP中心地理位置。可选的,每一信息对中的地理位置信息包括经度信息和纬度信息,所述对所述IP地址关联的地理位置信息进行统计,以得到所述IP地址对应的IP中心地理位置包括:将所述IP地址关联的经度信息组成经度数据集,并将所述IP地址关联的纬度信息组成纬度数据集;利用所述经度数据集拟合第一高斯分布曲线,以得到所述第一高斯分布曲线的第一数学期望;利用所述纬度数据集拟合第二高斯分布曲线,以得到所述第二高斯分布曲线的第二数学期望;将所述第一数学期望和所述第二数学期望作为所述IP地址对应的IP中心地理位置。可选的,在对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置之后,所述定位方法还包括:将所述IP地址及其对应的IP中心地理位置存储至数据库中。为解决上述技术问题,本专利技术实施例还提供一种流量数据的定位装置,包括:提取模块,适于从一组流量数据中提取多个信息对,每一信息对包括IP地址及其关联的地理位置信息;统计模块,适于对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置;确定模块,适于接收待定位的流量数据,根据所述待定位的流量数据的IP地址以及确定的所述IP地址的中心地理位置,得到所述待定位的流量数据的地理位置信息。可选的,所述定位装置还包括:过滤模块,适于对所述多个信息对进行统计之前,根据IP地址与地理位置的预设匹配关系,对所述多个信息对进行过滤,以剔除IP地址与其关联的地理位置信息不匹配的信息对。可选的,所述统计模块包括:划分子模块,适于根据IP地址划分所述多个信息对,将具有相同IP地址的信息对划分为同一信息簇;统计子模块,适于针对每一信息簇中的IP地址,对所述IP地址关联的地理位置信息进行统计,以得到所述IP地址对应的IP中心地理位置。为解决上述技术问题,本专利技术实施例还提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述方法的步骤。为解决上述技术问题,本专利技术实施例还提供一种服务器,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述方法的步骤。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例提供一种流量数据的定位方法,包括:从一组流量数据中提取多个信息对,每一信息对包括IP地址及其关联的地理位置信息;对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置;接收待定位的流量数据,根据所述待定位的流量数据的IP地址以及确定的所述IP地址的中心地理位置,得到所述待定位的流量数据的地理位置信息。通过本专利技术实施例提供的技术方案,可以利用大量流量数据中的地理位置信息,统计出每一IP地址对应的IP中心地理位置,其准确度较高,从而可以为待定位的流量数据提供位置信息。进一步,可以得到产生该待定位的流量数据的移动用户的地理位置信息。进一步,对所述多个信息对进行统计之前,所述方法还包括:根据IP地址与地理位置的预设匹配关系,对所述多个信息对进行过滤,以剔除IP地址与其关联的地理位置信息不匹配的信息对。本专利技术实施例可以在对多个信息对进行统计之前,采用当前技术方案滤掉无效信息对,进一步有利于统计出准确度高的IP中心地理位置。进一步,在对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置之后,所述定位方法还包括:将所述IP地址及其对应的IP中心地理位置存储至数据库中。在后续处理待定位的流量数据时,可以直接搜索数据库得到所述待定位的流量数据的位置信息,本专利技术实施例有利于减少重复统计过程。附图说明图1是本专利技术实施例的一种流量数据的定位方法的流程示意图;图2是本专利技术实施例的一种流量数据的定位装置的结构示意图。具体实施方式本领域技术人员理解,如
技术介绍
所言,现有技术中的流量数据可能缺失经纬度信息,或者,经纬度信息不正确,又或者,经纬度信息指向的地理位置信息的定位精度较低。本申请专利技术人经研究发现,现有技术中,真实的IP地址与其地理位置信息是相对固定的,具有预设匹配关系。通过IP地址确定与地理位置的预设匹配关系,通常可以对应到城市地理位置。例如,某一IP地址匹配的地理位置信息为中国上海,另一IP地址匹配的地理位置信息为中国北京,其地理位置信息的定位精度太低。此外,现有技术中也可能存在虚假流量。虚假流量的IP地址和与之关联的位置信息(例如,经纬度数据)通常是随机生成的。如果直接采用虚假流量提供的IP地址关联的位置信息,那么将产生错误的定位结果。本专利技术实施例提供一种流量数据的定位方法,包括:从一组流量数据中提取多个信息对,每一信息对包括IP地址及其关联的地理位置信息;对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置;接收待定位的流量数据,根据所述待定位的流量数据的IP地址以及确定的所述IP地址的中心地理位置,得到所述待定位的流量数据的地理位置信息。通过本专利技术实施例提供的技术方案,可以利用大量流量数据中的地理位置信息,统计出每一IP地址对应的IP中心地理位置,其准确度较高,从而可以为待定位的流量数据提供位置信息。进一步,可以得到产生该待定位的流量数据的移动用户的地理位置信息。为使本专利技术的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本专利技术的具体实施例做详细的说明。本文所使用的术语“包含”、“包括”及类似术语应该被理解为是开放性的术语,即“包括本文档来自技高网
...

【技术保护点】
1.一种流量数据的定位方法,其特征在于,包括:从一组流量数据中提取多个信息对,每一信息对包括IP地址及其关联的地理位置信息;对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置;接收待定位的流量数据,根据所述待定位的流量数据的IP地址以及确定的所述IP地址的中心地理位置,得到所述待定位的流量数据的地理位置信息。

【技术特征摘要】
1.一种流量数据的定位方法,其特征在于,包括:从一组流量数据中提取多个信息对,每一信息对包括IP地址及其关联的地理位置信息;对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置;接收待定位的流量数据,根据所述待定位的流量数据的IP地址以及确定的所述IP地址的中心地理位置,得到所述待定位的流量数据的地理位置信息。2.根据权利要求1所述的定位方法,其特征在于,对所述多个信息对进行统计之前,还包括:根据IP地址与地理位置的预设匹配关系,对所述多个信息对进行过滤,以剔除IP地址与其关联的地理位置信息不匹配的信息对。3.根据权利要求1所述的定位方法,其特征在于,所述对所述多个信息对进行统计,以确定每一IP地址对应的IP中心地理位置包括:根据IP地址划分所述多个信息对,将具有相同IP地址的信息对划分为同一信息簇;针对每一信息簇中的IP地址,对所述IP地址关联的地理位置信息进行统计,以得到所述IP地址对应的IP中心地理位置。4.根据权利要求3所述的定位方法,其特征在于,每一信息对中的地理位置信息包括经度信息和纬度信息,所述对所述IP地址关联的地理位置信息进行统计,以得到所述IP地址对应的IP中心地理位置包括:将所述IP地址关联的经度信息组成经度数据集,并将所述IP地址关联的纬度信息组成纬度数据集;利用所述经度数据集拟合第一高斯分布曲线,以得到所述第一高斯分布曲线的第一数学期望;利用所述纬度数据集拟合第二高斯分布曲线,以得到所述第二高斯分布曲线的第二数学期望;将所述第一数学期望和所述第二数学期望作为所述IP地址对应的IP中心地理位置。5...

【专利技术属性】
技术研发人员:汤奇峰葛虎跃
申请(专利权)人:上海晶赞融宣科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1