一种地域维度表生成方法、装置、服务器及存储介质制造方法及图纸

技术编号:29306205 阅读:18 留言:0更新日期:2021-07-17 01:50
本发明专利技术实施例公开了一种地域维度表生成方法、装置、服务器及存储介质。该方法包括:建立企业IP库;在所述企业IP库生成IP段离线表,所述IP段离线表包含IP对应的地理信息,所述地理信息包括省、市、区县、经纬度中的一个或多个;将所述IP段离线表生成地域标准表,所述地域标准表对各个字段进行统一格式化;将所述地域标准表生成地域维度表,所述地域维度表对字段进行扩展。本发明专利技术实施例的技术方案,通过对地域维度字段扩张、地域格式统一、批量融合企业设备对应的IP信息,提高了地域维度表的性能,更好地方便分析用户的地理位置信息。更好地方便分析用户的地理位置信息。更好地方便分析用户的地理位置信息。

Method, device, server and storage medium for generating region dimension table

【技术实现步骤摘要】
一种地域维度表生成方法、装置、服务器及存储介质


[0001]本专利技术实施例涉及数据仓库
,尤其涉及一种地域维度表生成方法、装置、服务器及存储介质。

技术介绍

[0002]随着大数据的时代的兴起,很多大型企业都建立了自己的数据仓库,同时数据仓库中都会存储地域维度表以便于分析用户的地理位置信息。然而,市面常见的企业级地域维度表设计,有着不一样数据维度字段缺失和数据格式不统一等问题,亟需一种全新的地域维度表对上述问题进行弥补。

技术实现思路

[0003]本专利技术实施例提供一种地域维度表生成方法、装置、服务器及存储介质,以实现解决不一样数据维度字段缺失和数据格式不统一等问题。
[0004]第一方面,本专利技术实施例提供了一种地域维度表生成方法,包括:
[0005]建立企业IP库;
[0006]在所述企业IP库生成IP段离线表,所述IP段离线表包含IP对应的地理信息,所述地理信息包括省、市、区县、经纬度中的一个或多个;
[0007]将所述IP段离线表生成地域标准表,所述地域标准表对各个字段进行统一格式化;
[0008]将所述地域标准表生成地域维度表,所述地域维度表对字段进行扩展。
[0009]可选的,所述建立企业IP库,包括:
[0010]采用公司已知的IP来源进行融合建立企业IP库。
[0011]可选的,所述IP来源包括xload.base_all_log和/或default.ad_log。
[0012]可选的,在所述企业IP库生成IP段离线表之后,包括:
[0013]使用IP段离线表的API查询IP对应的地理信息。
[0014]可选的,所述地域标准表对各个字段进行统一格式化,包括:
[0015]所述地域标准表通过国标对各个字段进行统一格式化。
[0016]可选的,在建立企业IP库之前,还包括:
[0017]判断来源表是否有T日分区;
[0018]如果来源表都没有T日分区,则结束任务,如果来源表有T日分区,则去重合并成T日IP库。
[0019]可选的,在所述地域维度表对字段进行扩展之后,还包括:
[0020]通过对规范地域维度表对T日及历史数据进行去重,保存到地域维度表T日分区中。
[0021]第二方面,本专利技术实施例还提供了一种地域维度表生成装置,包括:
[0022]IP单元,用于建立企业IP库;
[0023]离线表单元,用于在所述企业IP库生成IP段离线表,所述IP段离线表包含IP对应的地理信息,所述地理信息包括省、市、区县、经纬度中的一个或多个;
[0024]标准表单元,用于将所述IP段离线表生成地域标准表,所述地域标准表对各个字段进行统一格式化;
[0025]维度表单元,用于将所述地域标准表生成地域维度表,所述地域维度表对字段进行扩展。
[0026]第三方面,本专利技术实施例还提供了一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中任一所述的地域维度表生成方法。
[0027]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中任一所述的地域维度表生成方法。
[0028]本专利技术实施例的技术方案,通过对地域维度字段扩张、地域格式统一、批量融合企业设备对应的IP信息,提高了地域维度表的性能,更好地方便分析用户的地理位置信息。
附图说明
[0029]图1是本专利技术实施例一中的一种地域维度表生成方法的流程示意图;
[0030]图2是本专利技术实施例二中的一种地域维度表生成装置的结构示意图;
[0031]图3是本专利技术实施例三中的一种服务器的结构示意图。
具体实施方式
[0032]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0033]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0034]此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一速度差值称为第二速度差值,且类似地,可将第二速度差值称为第一速度差值。第一速度差值和第二速度差值两者都是速度差值,但其不是同一速度差值。术语“第一”、“第二”等不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0035]实施例一
[0036]图1为本专利技术实施例一提供的一种地域维度表生成方法的流程示意图,本专利技术实施例可适用于分析用户的地理位置信息的情况。本专利技术实施例的方法可以由一种地域维度
表生成装置来执行,该装置可以由软件和/或硬件的方式实现,并一般可集成于服务器或终端设备中。参照图1,本专利技术实施例的地域维度表生成方法,具体包括如下步骤:
[0037]步骤S110、建立企业IP库。
[0038]具体的,全球共有2
32
个IPv4地址,估计约42.9亿个,删除一些特殊IP和一些不可用的IP后,剩余的可用IP小于40亿,其中中国国内IP大约有13亿个,这么大的数据量无法满足企业级批处理及存储。因此,本实施例中,企业级地域维度表采用公司已知的IP来源进行融合建立企业IP库,这样满足公司现有业务同时数据量会极大减少。例如,IP来源包括但不限于xload.base_all_log、default.ad_log等等每日增量保存企业设备的IP信息。可以理解的,IP来源可以是其它途径来源,本实施例对此不作限定。
[0039]步骤S120、在所述企业IP库生成IP段离线表,所述IP段离线表包含IP对应的地理信息,所述地理信息包括省、市、区县、经纬度中的一个或多个。
[0040]具体的,企业IP库可以通过IP段获取省市区县信息,在所述企业IP库生成IP段离线表,通过已知的设备IP库,使用IP段离线表的API进行查询IP对应的省、市、区县、经纬度等等对应的地理信息。例如,如表1所示,包括IP段离线表数据字段的字段名称、字段类、字段长度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地域维度表生成方法,其特征在于,包括:建立企业IP库;在所述企业IP库生成IP段离线表,所述IP段离线表包含IP对应的地理信息,所述地理信息包括省、市、区县、经纬度中的一个或多个;将所述IP段离线表生成地域标准表,所述地域标准表对各个字段进行统一格式化;将所述地域标准表生成地域维度表,所述地域维度表对字段进行扩展。2.根据权利要求1所述的地域维度表生成方法,其特征在于,所述建立企业IP库,包括:采用公司已知的IP来源进行融合建立企业IP库。3.根据权利要求2所述的地域维度表生成方法,其特征在于,所述IP来源包括xload.base_all_log和/或default.ad_log。4.根据权利要求1所述的地域维度表生成方法,其特征在于,在所述企业IP库生成IP段离线表之后,包括:使用IP段离线表的API查询IP对应的地理信息。5.根据权利要求1所述的地域维度表生成方法,其特征在于,所述地域标准表对各个字段进行统一格式化,包括:所述地域标准表通过国标对各个字段进行统一格式化。6.根据权利要求1所述的地域维度表生成方法,其特征在于,在建立企业IP库之前,还包括:判断来源表是否有T日分区;如果来源表都没...

【专利技术属性】
技术研发人员:余辉
申请(专利权)人:深圳市酷开网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1