一种数据处理方法及服务器技术

技术编号:17109923 阅读:44 留言:0更新日期:2018-01-24 22:30
本发明专利技术公开了一种数据处理方法及服务器,方法包括:获取到至少一条位置相关信息;从所述至少一条位置相关信息中获取到至少一条第一类位置相关信息;基于用户常用地址以及网络地址的位置信息对所述至少一条第一类位置相关信息进行汇聚得到至少一条第一类参考信息,其中,所述第一类参考信息表征在同一用户常用地址以及同一网络地址的位置信息出现的用户数量;基于所述至少一条第一类参考信息中的所述用户数量,选取得到异常的网络地址的位置信息,对所述异常的网络地址的位置信息进行修正以使得修正后的所述网络地址的位置信息与用户常用地址相同。

A data processing method and server

The invention discloses a data processing method and server. The method comprises the following steps: acquiring at least a location related information; from the at least one location related information to obtain at least a first class location related information; the user address and the network address of the common position information of the at least one first class position relevant information together get at least one first class reference information, which is based on the number of users, the first reference information representation in the location information of the same user address and used the same network address appears; the number of the at least the user a first reference information based on the selected location information of abnormal the network address, correct location information of the abnormal network address so that the modified the network address of the location information and common users The address is the same.

【技术实现步骤摘要】
一种数据处理方法及服务器
本专利技术涉及信息处理领域中的数据处理技术,尤其涉及一种数据处理方法及服务器。
技术介绍
通过移动终端上报的用户互联网协议(IP,InternetProtocol)地址可以判断用户所在的国家省份城市,甚至到街道级别。准确地定位海外用户位置不仅需要准确的实时更新的IP库、还需要用户的上报的IP为可信的IP。然而,维护IP库的更新需要较大的人力成本,而且也由于使用海外代理上网、虚拟专用网络(VPN,VirtualPrivateNetwork)等存在,用户上报的IP中有部分脏数据存在。手动维护更新IP库的方法为了达到较好效果,一般至少需要多个全职的人来维护,而且想提高效率,还需要做自动化验证和发现的开发工作,而且更新IP库也无法快速并且准确的解决用户使用代理带来的定位错误问题。
技术实现思路
本专利技术实施例提供一种数据处理方法及服务器,能至少解决现有技术中存在的上述问题。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种数据处理方法,包括:获取到至少一条位置相关信息,其中,所述位置相关信息至少包括网络地址的位置信息以及用户常用地址;从所述至少一条位置相关信息中获取到至少一条第一类位置相关信息;其中,所述第一类位置相关信息为位置相关信息中网络地址的位置信息与用户常用地址不同的位置相关信息;基于用户常用地址以及网络地址的位置信息对所述至少一条第一类位置相关信息进行汇聚得到至少一条第一类参考信息,其中,所述第一类参考信息表征在同一用户常用地址以及同一网络地址的位置信息出现的用户数量;基于所述至少一条第一类参考信息中的所述用户数量,选取得到异常的网络地址的位置信息,对所述异常的网络地址的位置信息进行修正以使得修正后的所述网络地址的位置信息与用户常用地址相同。本专利技术实施例提供一种服务器,所述服务器包括:信息获取单元,用于获取到至少一条位置相关信息,其中,所述位置相关信息至少包括网络地址的位置信息以及用户常用地址;第一选取单元,用于从所述至少一条位置相关信息中获取到至少一条第一类位置相关信息;其中,所述第一类位置相关信息为位置相关信息中网络地址的位置信息与用户常用地址不同的位置相关信息;汇聚单元,用于基于用户常用地址以及网络地址的位置信息对所述至少一条第一类位置相关信息进行汇聚得到至少一条第一类参考信息,其中,所述第一类参考信息表征在同一用户常用地址以及同一网络地址的位置信息出现的用户数量;第二选取单元,用于基于所述至少一条第一类参考信息中的所述用户数量,选取得到异常的网络地址的位置信息;修正单元,用于对所述异常的网络地址的位置信息进行修正以使得修正后的所述网络地址的位置信息与用户常用地址相同。本专利技术实施例中提供的数据处理方法及服务器,对全部用户设备对应的至少一条位置相关信息进行聚合,以得到在同一用户常用地址以及同一网络地址的位置信息出现的用户数量,然后利用用户数量选取存在异常的网络地址的位置信息,最后对异常的网络地址的位置信息进行修正。如此,就能够避免人工对错误的网络地址对应的位置信息进行修正而带来的较为耗时、以及正确率低的问题,提升了针对网络地址的位置信息的修正效率以及正确率。附图说明图1为本专利技术实施例中数据处理方法的实现流程示意图一;图2为本专利技术实施例确定第一类位置相关信息场景图;图3为本专利技术实施例生成第一类参考信息的示意图;图4为本专利技术实施例确定第一类参考信息的用户数量均值示意图;图5为本专利技术实施例参考矩阵示意图;图6为本专利技术实施例数据处理方法的实现流程示意图二;图7为本专利技术实施例选取用户常用地址的处理场景示意图;图8为本专利技术实施例服务器组成结构示意图一;图9为本专利技术实施例服务器组成结构示意图二。具体实施方式下面结合附图和具体实施例对本专利技术作进一步详细说明。实施例一、本专利技术实施例提供了一种数据处理方法,如图1所示,包括:步骤101:获取到至少一条位置相关信息,其中,所述位置相关信息至少包括网络地址的位置信息以及用户常用地址;步骤102:从所述至少一条位置相关信息中获取到至少一条第一类位置相关信息;其中,所述第一类位置相关信息为位置相关信息中网络地址的位置信息与用户常用地址不同的位置相关信息;步骤103:基于用户常用地址以及网络地址的位置信息对所述至少一条第一类位置相关信息进行汇聚得到至少一条第一类参考信息,其中,所述第一类参考信息表征在同一用户常用地址以及同一网络地址的位置信息出现的用户数量;步骤104:基于所述至少一条第一类参考信息中的所述用户数量,选取得到异常的网络地址的位置信息,对所述异常的网络地址的位置信息进行修正以使得修正后的所述网络地址的位置信息与用户常用地址相同。本方案提供的处理方法可以应用于服务器侧,尤其是进行大数据分析的服务器侧。上述获取到至少一条位置相关信息的方式可以为:从数据库中获取到第一预设时长内至少一条位置相关信息。其中,所述第一预设时长可以根据实际情况进行设置,比如,可以计算一天之内。进一步地,所述至少一条位置相关信息可以根据用户通过用户设备上报的用户设备的标识信息、网络地址的位置信息,再结合用户常用地址来生成。其中,所述用户常用地址,用于表示用户的常驻地址,比如,用户所在的国家、所在省市等,所述用户常用地址可以根据实际情况进行设置,也可以根据数据库中保存的信息生成,本实施例中不对具体如何获取到用户常用地址进行限定。需要说明的是,所述位置相关信息中除了网络地址的位置信息以及用户常用地址之外,还可以包括:用户设备的标识信息、网络地址。相应的,所述网络地址的位置信息可以为根据网络地址确定的位置信息,用于表征用户设备当前的定位的位置信息。所述从至少一个位置信息中获取到第一类位置相关信息,可以为:对至少一个位置相关信息中每一个位置相关信息均判断其中包含的网络地址的位置信息与用户常用地址是否对应相同区域,若不相同,则确定为第一类位置相关信息;若相同,可以确定位置信息为第二类位置相关信息。比如,参见图2,用户设备对应两个位置相关信息,分别为位置相关信息一和二,假设位置相关信息一种用户常用地址为位置A、网络地址的位置信息为位置B,而位置相关信息二中用户常用地址以及网络地址的位置信息均为位置A,那么可以选取位置相关信息一作为第一类位置相关信息,剩余的位置相关信息二则为第二类位置相关信息。也就是说,当两个地址不相同的时候,可以初步确定用户当前不在国内或者不在用户的常驻省市区域。其中,所述网络地址的位置信息中可以包括有以下至少之一:城市、省份、国家。另外,用户常用地址可以为城市、省份以及国家中的一个或多个。进一步地,所述对至少一个位置相关信息中每一个位置相关信息均判断其中包含的网络地址的位置信息与用户常用地址是否对应相同区域,可以根据划分的区域的大小具备多种处理方式:处理方式一、获取到每一个位置相关信息中网络地址的位置信息对应的国家,获取到用户常用地址对应的国家,判断位置信息对应的国家与所述用户常用地址对应的国家是否相同,若相同则对应相同区域,否则,对应不同区域。处理方式二、获取到每一个位置相关信息中网络地址的位置信息对应的省份,获取到用户常用地址对应的省份,判断位置信息对应的省份与所述用户常用地址对应的省份是否相同,若相同则对应相同区域,否则,对应不同区域。处理方式本文档来自技高网...
一种数据处理方法及服务器

【技术保护点】
一种数据处理方法,其特征在于,所述方法包括:获取到至少一条位置相关信息,其中,所述位置相关信息至少包括网络地址的位置信息以及用户常用地址;从所述至少一条位置相关信息中获取到至少一条第一类位置相关信息;其中,所述第一类位置相关信息为位置相关信息中网络地址的位置信息与用户常用地址不同的位置相关信息;基于用户常用地址以及网络地址的位置信息对所述至少一条第一类位置相关信息进行汇聚得到至少一条第一类参考信息,其中,所述第一类参考信息表征在同一用户常用地址以及同一网络地址的位置信息出现的用户数量;基于所述至少一条第一类参考信息中的所述用户数量,选取得到异常的网络地址的位置信息,对所述异常的网络地址的位置信息进行修正以使得修正后的所述网络地址的位置信息与用户常用地址相同。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取到至少一条位置相关信息,其中,所述位置相关信息至少包括网络地址的位置信息以及用户常用地址;从所述至少一条位置相关信息中获取到至少一条第一类位置相关信息;其中,所述第一类位置相关信息为位置相关信息中网络地址的位置信息与用户常用地址不同的位置相关信息;基于用户常用地址以及网络地址的位置信息对所述至少一条第一类位置相关信息进行汇聚得到至少一条第一类参考信息,其中,所述第一类参考信息表征在同一用户常用地址以及同一网络地址的位置信息出现的用户数量;基于所述至少一条第一类参考信息中的所述用户数量,选取得到异常的网络地址的位置信息,对所述异常的网络地址的位置信息进行修正以使得修正后的所述网络地址的位置信息与用户常用地址相同。2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一条第一类参考信息中的所述用户数量,选取得到异常的网络地址的位置信息,包括:根据所述至少一条第一类参考信息中的用户数量计算得到全部用户数量的均值;至少根据所述均值,从所述至少一条第一类参考信息中选取出至少部分第一类参考信息;将选取到的至少部分第一类参考信息对应的网络地址的位置信息作为异常的网络地址的位置信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述至少一条第一类参考信息中的用户数量计算得到全部用户数量的均值之前,所述方法包括:根据所述第一类参考信息构建参考矩阵,所述参考矩阵中包含有m行n列的元素,每一个元素用于表示一用户常用地址以及一网络地址的位置信息对应的用户数量;m和n均为大于等于1的整数。4.根据权利要求3所述的方法,其特征在于,所述根据所述至少一条第一类参考信息中的用户数量计算得到全部用户数量的均值,包括:对所述参考矩阵中m行中每一行的元素进行求和,以得到m行中每一行对应的元素和;对所述参考矩阵中n列中每一列的元素进行求和,以得到n列中每一列对应的元素和;基于所述每一行对应的元素和以及每一列对应的元素和,计算得到针对每一个元素的目标误差率,并且计算得到全部元素中包含的全部用户数量的均值;相应的,所述至少根据所述均值,从所述至少一条第一类参考信息中选取出至少部分第一类参考信息包括:从所述参考矩阵中,选取目标误差率大于第一门限值、并且用户数量大于所述全部用户数量的均值的元素;将选取到的元素对应的第一类参考信息作为选取到的第一类参考信息。5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取到至少一条位置相关信息,包括:从数据库中获取到至少一个用户设备中每一个用户设备的用户常用地址以及至少一条数据位置关联信息,所述数据位置关联信息中至少包括有用户设备的标识信息、网络地址的位置信息;基于所述用户设备的标识信息,至少将用户常用地址以及网络地址位置信息进行关联得到至少一条位置相关信息。6.根据权利要求5所述的方法,其特征在于,所述从数据库中获取到至少一个用户设备中每一个用户设备的用户常用地址以及至少一条数据位置关联信息之前,所述方法还包括:获取到至少一个用户设备上报的数据信息,基于每一个用户设备上报的数据信息确定数据信息的网络地址以及数据位置关联信息;确定每一个用户设备对应的数据位置关联信息中包含的网络地址的位置信息的出现频次,根据所述出现频次选取得到所述每一个用户设备的用户常用地址。7.根据权利要求5所述的方法,其特征在于,所述从数据库中获取到至少一个用户设备中每一个用户设备的用户常用地址以及至少一条数据位置关联信息之前,所述方法还包括:根据所述至少一个用户设备对应的数据位置关联信息,选取得到至少一个异常用户设备;判断每一个异常用户设备的网络地址的位置信息中是否包含有异常位置信息,得到判断结果;若所述判断结果表征异常用户设备的网络地址的位置信息中包含有异常位置信息,则基于所述异常位置信息对所述异常用户设备的网络地址及其数据位置关联信息进行筛选得到所述异常用户设备筛选后的网络地址及其数据位置关联信息。8.根据权利要求7所述的方法,其特征在于,所述判断每一个异常用户设备的网络地址的位置信息中是否包含有异...

【专利技术属性】
技术研发人员:叶佳木余传伟
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1