【技术实现步骤摘要】
本专利技术涉及互联网
,特别是涉及一种坐标系统的识别方法及装置。
技术介绍
流量数据基于用户对URL的访问而产生,在一些涉及需要定位用户地理位置信息的应用(application)中,当用户访问该应用的URL,所产生的流量数据中携带了用户当前所处的位置信息,这些用户的位置信息可以采用不同类型的坐标系统来表示,例如可以用WGS-84坐标系统、CCJ-02系统或BD-09坐标系统来表示。一般而言,不同的应用所采用的域名相应不同,而不同域名所采用的坐标系统也有可能不同。用户的位置信息是对用户数据进行分析(例如大数据分析)的重要数据基础,因此,识别流量数据中位置信息所使用的坐标系统很有必要。
技术实现思路
本专利技术解决的技术问题是提供一种坐标系统的识别方法及装置,以识别出不同域名所采用的坐标系统。为解决上述技术问题,本专利技术实施例提供一种坐标系统的识别方法,包括:获取流量数据集,所述流量数据集中每条流量数据包括域名信息、位置信息和转发设备的标识,所述位置信息所使用的坐标系统与所述域名信息对应;从所述流量数据集中确定部分流量数据作为参考流量数据,所述参考流量数据以外的流量数据为待识别流量数据,所述参考流量数据的位置信息所使用的坐标系统已知,所述待识别流量数据的位置信息所使用的坐标系统未知;筛选所述流量数据集涉及的转发设备中的稳定设备,并根据包含所述稳定设备的标识的参考URL数据的位置信息,确定该稳定设备的位置,所述稳定设备为位置固定的转发设备;根据所述稳定设备的位置,确定包含所述稳定设备的标识的待识别流量数据的位置信息所使用的坐标系统。可选地,从所述流量数据 ...
【技术保护点】
一种坐标系统的识别方法,其特征在于,包括:获取流量数据集,所述流量数据集中每条流量数据包括域名信息、位置信息和转发设备的标识,所述位置信息所使用的坐标系统与所述域名信息对应;从所述流量数据集中确定部分流量数据作为参考流量数据,所述参考流量数据以外的流量数据为待识别流量数据,所述参考流量数据的位置信息所使用的坐标系统已知,所述待识别流量数据的位置信息所使用的坐标系统未知;筛选所述流量数据集涉及的转发设备中的稳定设备,并根据包含所述稳定设备的标识的参考URL数据的位置信息,确定该稳定设备的位置,所述稳定设备为位置固定的转发设备;根据所述稳定设备的位置,确定包含所述稳定设备的标识的待识别流量数据的位置信息所使用的坐标系统。
【技术特征摘要】
1.一种坐标系统的识别方法,其特征在于,包括:获取流量数据集,所述流量数据集中每条流量数据包括域名信息、位置信息和转发设备的标识,所述位置信息所使用的坐标系统与所述域名信息对应;从所述流量数据集中确定部分流量数据作为参考流量数据,所述参考流量数据以外的流量数据为待识别流量数据,所述参考流量数据的位置信息所使用的坐标系统已知,所述待识别流量数据的位置信息所使用的坐标系统未知;筛选所述流量数据集涉及的转发设备中的稳定设备,并根据包含所述稳定设备的标识的参考URL数据的位置信息,确定该稳定设备的位置,所述稳定设备为位置固定的转发设备;根据所述稳定设备的位置,确定包含所述稳定设备的标识的待识别流量数据的位置信息所使用的坐标系统。2.根据权利要求1所述的坐标系统的识别方法,其特征在于,从所述流量数据集中确定部分流量数据作为参考流量数据,包括:根据所述域名信息对所述流量数据进行统计,以得到多种域名信息各自对应的流量数据的数量;根据对应的流量数据的数量,确定所述多种域名信息中的一部分作为参考域名信息,并将包含所述参考域名信息的流量数据作为所述参考流量数据。3.根据权利要求2所述的坐标系统的识别方法,其特征在于,所述参考流量数据的位置信息所使用的坐标系统采用如下方式确定:基于用户在已知位置对所述参考域名信息的访问,得到包含所述参考域名信息的临时流量数据;根据所述已知位置和所述临时流量数据中包含的位置信息,确定所述参考流量数据的位置信息所使用的坐标系统。4.根据权利要求1所述的坐标系统的识别方法,其特征在于,根据包含所述稳定设备的标识的参考URL数据的位置信息,确定该稳定设备的位置,包括:将所述稳定设备的标识相同的参考流量数据的位置信息统一为预设类型;根据统一为所述预设类型的所述参考流量数据的位置信息,确定该稳定设备的位置信息。5.根据权利要求4所述的坐标系统的识别方法,其特征在于,根据统一为所述预设类型的所述参考流量数据的位置信息,确定该稳定设备的位置信息,包括:采用以下公式计算所述稳定设备的经度和纬度:x=Σi=1ncoslatitudei*coslongtitudei/n,y=Σi=1ncoslatitudei*sinlongtitudei/n,]]>z=Σi=1nsinlatitudei/n,centrallongtitude=tan-1yx,centrallatitude=tan-1zx2+y22;]]>其中,n为参考流量数据的条数,i为大于等于1且小于n的正整数,latitudei为第i条参考流量数据对应的纬度,longtitudei为第i条参考流量数据对应的经度,centrallatitude为所述稳定设备的纬度,centrallongtitude为所述稳定设备的经度。6.根据权利要求4所述的坐标系统的识别方法,其特征在于,根据所述稳定设备的位置,确定包含所述稳定设备的标识的待识别流量数据的位置信息所使用的坐标系统,包括:假设所述待识别流量数据的位置信息所使用的坐标系统,并采用假设的坐标系统计算所述待识别流量数据的位置信息与所述稳定设备的位置之间的距离;当计算得到的距离小于第一阈值时,确定所述假设的坐标系统为所述待识别流量数据的位置信息所使用的坐标系统。7.根据权利要求1所述的坐标系统的识别方法,其特征在于,筛选所述流量数据集涉及的转发设备中的稳定设备,包括:计算包含所述转发设备的标识的任意两个参考流量数据的位置信息对应位置间的距离;当所述距离小于第二阈值时,确定所述转发设备为稳定设备。8.根据权利要求7所述的坐标系统的识别方法,其特征在于,所述每条流量数据还包括发起该条流量数据的移动设备的标识,所述第二阈值通过以下方式确定:以所述转发设备为圆心,根据所述移动设备的标识,计算在不同半径内,所产生的流量经所述转发设备转发的移动设备的数量,占据产生所述流量数据集的移动产生设备的数量的比例;当所述比例在连续单位时间内变化梯度小于梯度阈值时,确定该半径为所述第二阈值。9.根据权利要求1所述的坐标系统的识别方法,其特征在于,筛选所述流量数据集涉及的转发设备中的稳定设备,包括:在预设时间段的多个连续单位时间内,分别统计每单位时间内所述转发设备标识相同的流量数据对应的移动设备的数量,从而得到所述多个连续单位时间的移动设备的总数量,并记为第一总量;统计所述预设时间段内包含该转发设备标识的流量数据对应的移动产生设备的数量,并记为第二总量;当所述第二总量与所述第一总量的比值小于比例阈值时,判定所述转发设备为稳定设备。10.一种坐标系统的识别装置,其特征在于,包括:获取单元,适于获取流量数据集,所述流量数据集中每条...
【专利技术属性】
技术研发人员:汤奇峰,古丽米热·艾力肯,
申请(专利权)人:晶赞广告上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。